日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

【图像分割模型】从FCN说起

發布時間:2025/3/20 40 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【图像分割模型】从FCN说起 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

今天開啟新的專欄《圖像分割模型》。在這里,我們將共同探索解決分割問題的主流網絡結構和設計思想,這是第1篇文章。

今天要說的是占據了圖像分割編解碼結構大半江山的Fully Convolutional Network(FCN)。

作者 | 孫叔橋

編輯 | 言有三

?

1 什么是分割

分割,顧名思義,就是把一個完整的東西按照某種方式或規則分成若干個部分。

那么什么是圖像分割呢?簡單來說,就是把圖像中屬于同一類別或同一個體的東西劃分在一起,并將各個子部分區分開來。像下圖這樣:

為了訓練神經網絡,圖片中這些像素點會按照某種規則被貼上一個“標簽”,比如這個像素點是屬于人、天空、草地還是樹;更詳細一點,可以再給它們第二個標簽,聲明它們是屬于“哪一個人”或“哪一棵樹”。

對于只有一個標簽的(只區分類別)的任務,我們稱之為“語義分割”(semantic segmentation);對于區分相同類別的不同個體的,則稱之為實例分割(instance segmentation)。由于實例分割往往只能分辨可數目標,因此,為了同時實現實例分割與不可數類別的語義分割,2018年Alexander Kirillov等人提出了全景分割(panoptic segmentation)的概念。

下圖分別展示了(a)原始圖像,(b)語義分割,(c)實例分割和(d)全景分割。

?

2 FCN

目前在圖像分割領域比較成功的算法,有很大一部分都來自于同一個先驅:Long等人提出的Fully Convolutional Network(FCN),也就是今天我們要討論的網絡結構。FCN將分類網絡轉換成用于分割任務的網絡結構,并證明了在分割問題上,可以實現端到端的網絡訓練。基于此,FCN成為了深度學習解決分割問題的奠基石。

目標識別網絡(分類網絡)盡管表面上來看可以接受任意尺寸的圖片作為輸入,但是由于網絡結構最后全連接層的存在,使其丟失了輸入的空間信息,因此,這些網絡并沒有辦法直接用于解決諸如分割等稠密估計的問題。

考慮到這一點,FCN用卷積層和池化層替代了分類網絡中的全連接層,從而使得網絡結構可以適應像素級的稠密估計任務。如下圖所示,這種全卷積網絡結構不僅能夠支持稠密估計,而且能夠實現端到端的訓練。

輸入:整幅圖像。

輸出:空間尺寸與輸入圖像相同,通道數等于全部類別個數。

真值:通道數為1(或2)的分割圖像。

(1)全連接層轉換成卷積層

如前文所述,將全連接層替換成卷積層的優勢之一,是可以使網絡用于稠密估計任務,并實現端到端訓練。比如下圖中,將全連接層替換成卷積層后,可以使得網絡輸出一個熱度圖(heatmap),而非單個類別標簽。

而這種做法的另外一個優勢就是,通過接收整幅圖像作為輸入,而非以圖塊的形式處理圖片,網絡在處理速度上也有了明顯提升。

(2)連接不同尺度下的層

分類網絡通常會通過設置步長的方式逐漸減小每層的空間尺寸,這種方式可以同時實現計算量的縮小和信息的濃縮。盡管這種操作對于分類任務是很有效的,但是對于分割這樣需要稠密估計的任務而言,這種濃縮就未必是好事了。

比如下面這張圖就是全局步長32下的分割效果。雖然實現了分割,但是結果很粗糙,看不出來目標的細節。

于是,為了解決這個問題,FCN將不同全局步長下的層之間進行連接。具體網絡結構如下圖所示。

這樣一來,隨著細節信息的逐漸加入,分割的結果也越來越好。比如下圖從左到右分別對應了全局步長32、全局步長16和全局步長8下的結果。最右側是真值。

?

3 實驗結果

FCN可以與大部分分類網絡有效結合,下表中給出了在PASCAL VOC 2011數據庫下,FCN與AlexNet、FCN-VGG16和FCN-GoogLeNet結合的結果。

?

4 總結與思考

盡管FCN意義重大,在當時來講效果也相當驚人,但是FCN本身仍然有許多局限。比如:

沒有考慮全局信息

無法解決實例分割問題

速度遠不能達到實時

不能夠應對諸如3D點云等不定型數據

基于此,各路研究大神們提出了針對不同局限的各種方法。下圖給出了部分研究成果與FCN的關系。

今天的圖像分割模型到此結束,下回再見。

本專欄文章:

第一期:【圖像分割模型】從FCN說起

第二期:【圖像分割模型】編解碼結構SegNet

第三期:【圖像分割模型】感受野與分辨率的控制術—空洞卷積

如果想加入我們,后臺留言吧

轉載文章請后臺聯系

侵權必究

感謝各位看官的耐心閱讀,不足之處希望多多指教。后續內容將會不定期奉上,歡迎大家關注有三公眾號 有三AI

總結

以上是生活随笔為你收集整理的【图像分割模型】从FCN说起的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。