语义分割改进:通过视频传播和标签松弛
語義分割改進:通過視頻傳播和標簽松弛
Improving Semantic Segmentation via Video Propagation and Label
Relaxation
論文地址:https://arxiv.org/abs/1812.01593
摘要
本文提出了一個視頻預測-以方法論為基礎,通過綜合新的訓練樣本,以便提高語義切分的準確性網絡。利用視頻預測模型能夠預測未來的幀,同時預測未來的標簽。
聯合傳播提出了緩解mis的策略-合成樣品中的排列。證明訓練分段模型由合成樣本擴充的數據集導致準確度的顯著提高。
還引入了一個新的邊界標簽,使訓練強健的放松技巧,沿著物體邊界消除噪聲和傳播偽影。該方法在Cityscape上實現83.5% 和CamVid 上82.9%的mIoUs。單一模型,不是模型集合,在KITTI語義切分測試中達到72.8%的mIoU,超過了2018年羅伯挑戰賽。
在kitti數據集語義分割中,性能指標排名第一。
創新點
的貢獻總結如下:
?建議利用視頻預測模型將標簽傳播到相鄰幀。
?引入了聯合圖像標簽傳播來緩解錯誤對齊問題。
?建議通過最大化沿邊界的類概率聯合的可能性來放松一個熱標簽訓練。這將產生更精確的模型,并允許執行更長的距離傳播。
?在分割性能方面,將基于視頻預測的方法與基于標準光流的方法進行了比較。
Parameters:
Details can be found here:
Arxiv Link: https://arxiv.org/abs/1812.01593
Detailed Results
對于前20個測試圖像,顯示原始圖像、彩色編碼結果和錯誤圖像。錯誤圖像包含4種顏色:
紅色:像素有錯誤的標簽和錯誤的類別
黃色:像素的標簽不正確,但類別正確
綠色:像素有正確的標簽
黑色:groundtruth標簽不用于評估
測試集均值
Test Image 0
Input Image
Prediction
總結
以上是生活随笔為你收集整理的语义分割改进:通过视频传播和标签松弛的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: YOLOv4:目标检测(windows和
- 下一篇: 3D惯导Lidar SLAM