论文阅读笔记03-fast-rcnn
fast-rcnn主要有如下改變:
1.引入ROI-pooling層
2.并行進行classification和bonnd box regression
下面詳細介紹
1.引入ROI-pooling層
R-CNN 在網(wǎng)絡前半部分提取特征時,對每個候選區(qū)域都進行了特征提取,導致大量重復計算,速度極低。
在fast-rcnn中提出roi-pooling層,有效解決這一問題。
roi_pool層將每個候選區(qū)域均勻分成M×N塊,對每塊進行max pooling。將特征圖上大小不一的候選區(qū)域轉(zhuǎn)變?yōu)榇笮〗y(tǒng)一的數(shù)據(jù),送入下一層。
注意:特征提取網(wǎng)絡的參數(shù)訓練過程類似于RCNN網(wǎng)絡中的過程,即將網(wǎng)絡尾端加上1000類的分類層,用image-net數(shù)據(jù)集訓練,然后凍結(jié)網(wǎng)絡前半部分參數(shù)作為特征提取網(wǎng)絡的參數(shù)。
2.并行進行classification和bonnd box regression
特征提取網(wǎng)絡得到的feature-map送入兩個并行的網(wǎng)絡進行classification和bonnd box regression。
cls_score層用于分類,輸出K+1維數(shù)組p,表示屬于K類和背景的概率。
bbox_prdict層用于調(diào)整候選區(qū)域位置,輸出4*K維數(shù)組t,表示分別屬于K類時,應該平移縮放的參數(shù)。
轉(zhuǎn)載于:https://www.cnblogs.com/yeran/p/10887241.html
總結(jié)
以上是生活随笔為你收集整理的论文阅读笔记03-fast-rcnn的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Excel-数据分列的多种方法实现
- 下一篇: 这世界没有意义