【数据竞赛】2020首届海洋目标智能感知国际挑战赛冠军方案分享
作者:歐奕旻、左育莘、楊銳
賽事回顧
2020年12月22日由中國造船工程學會等單位主辦,哈爾濱工程大學承辦,武漢理工大學協(xié)辦的首屆“海洋目標智能感知國際挑戰(zhàn)賽”落下帷幕。秉承 “逐夢海洋,感知智能,突破自我,創(chuàng)新未來”的精神,來自清華大學深圳國際研究生院的“秀姐和她快樂的小伙伴”隊,由歐奕旻、左育莘和楊銳組成,在李秀教授的指導下從150支參賽隊伍中脫穎而出,榮獲研究生組冠軍。
活動官方網站:
https://www.smartship.cn
https://www.hwtelcloud.com (NAIE網站)
選手分享
1
賽題描述
本次大賽要求參賽選手通過定位圖片中出現(xiàn)目標的位置(邊界框坐標),識別每個目標示例的類別和屬于該類的置信度,從而完成多類海洋船舶目標檢測識別任務。為了評估算法的實用性,比賽采用COCO形式的平均精度均值mAP,不僅可以評估模型的分類能力,也能體現(xiàn)出模型的定位能力。
2
模型介紹
本次比賽我們以Cascade RCNN作為baseline,以Res2Net101作為Backbone;通過逐步融合如soft-NMS、可變卷積(DCN)、多尺度訓練(SNIP)等提升檢測效果的方法,組成了最終的模型。
1. Baseline的選取
執(zhí)行目標檢測任務的雙階段算法一直在各大比賽中占據(jù)著半壁江山。CascadeRCNN通過級聯(lián)多個RCNN head,逐步微調候選框位置,解決了訓練階段和測試階段候選框的質量與分布不匹配問題。所以,為了保證檢測效果,我們采用該算法作為baseline。
網絡結構圖 圖源|CascadeRCNN[1]
2. Backbone的選取
ResNet通過在每兩層或三層之間增加短路機制、引入殘差學習的方式解決了深度網絡的退化問題。Res2Net網絡則基于ResNet,在單個殘差塊內構造分層的殘差類連接,增加了每個網絡層的感受野范圍,并實現(xiàn)了以更細粒度表示多尺度特征的功能。這種結構可以增加卷積網絡學習的信息量,明顯的提高模型的分類效果。在使用ResNet101做了對比實驗后,我們選擇Res2Net101作為backbone。
Res2Net殘差結構 圖源|Res2Net[2]
3
提升技巧
比賽過程中,我們通過不斷增加提升技巧的方式驗證各種技巧的適用性。先以CascadeRCNN+ResNet101作為baseline,在公開測試集A上的mAP=64.68%,增加所有提升技巧之后在公開測試集A上的mAP=67.09%。
1. Albu數(shù)據(jù)增強
在計算機視覺任務中,數(shù)據(jù)增強是一種常用的增加模型魯棒性的方法。Albumentation是一種快速靈活的數(shù)據(jù)增強庫,我們采用該方法后,雖然mAP值降低了0.36%,但是我們認為這對結果基本沒有影響,且會增加模型的泛化性能。
2. SNIP多尺度訓練和多尺度測試
通過觀察數(shù)據(jù)集,我們發(fā)現(xiàn)一些目標船舶占據(jù)的大部分,還有一些目標船舶非常小,這種極端尺度的目標在anchor機制中很難被分到前景中。多尺度訓練和多尺度測試SNIP方法可以將圖片縮放至不同的分辨率,使得目標以不同的比例出現(xiàn)在檢測器中,從而實現(xiàn)大目標和小目標均可被檢測到的功能。開始時我們就將該技巧使用在baseline中。
3. DCN
可變卷積網絡(DCN)具有適應待檢測目標發(fā)生空間形變的能力,能夠根據(jù)需要識別的內容進行動態(tài)調整,從而改變感受野范圍。采用該技巧之后,mAP值提升接近2%。
4. soft-NMS
從數(shù)據(jù)集中分析得知,一些圖片中船舶與島嶼之間存在重疊,一些小型船只與巨輪之間也存在重疊,這種重疊的目標容易出現(xiàn)False Positive,從而對AP值產生影響,所以我們采取soft-NMS方法。這種方法可以通過降低重疊區(qū)域候選框的得分來避免盲目刪除重疊候選框。
5.HTC模型預訓練
HTC模型是一種引入了語義分割模塊的的混合級聯(lián)網絡,因為語義分割是對全圖進行的像素級分類,對前景和背景有較強分辨能力,所以HTC模型學習的參數(shù)更好。我們使用該網絡在COCO數(shù)據(jù)集上預訓練,然后將其部分參數(shù)遷移到我們的模型上。
另外,因為Adam優(yōu)化算法可以較好的適應陌生數(shù)據(jù)集,我們使用它來做優(yōu)化;我們還使用了學習率熱身(warm-up)來穩(wěn)定訓練過程。
4
總結展望
非常感謝主辦方提供的參賽機會,李秀教授的悉心指導,以及華為NAIE網絡人工智能云服務提供的AI模型訓練平臺。本次比賽不僅提高了我們對目標檢測算法的掌握程度,還增加了我們海洋船舶方面的知識。但是,我們的模型仍然存在較大的進步空間,比如在使用Albu數(shù)據(jù)增強時,也應該做一個對比實驗進行驗證。最后,希望智慧海洋技術快速發(fā)展,助力我國海洋強國的建設!
●浩瀚論劍,等你來戰(zhàn)!2020年首屆海洋目標智能感知國際挑戰(zhàn)賽即將開賽
參考文獻
[1] Cai Z, Vasconcelos N. Cascade R-CNN: delving into high quality object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018: 6154-6162.
[2] Gao S , Cheng M M , Zhao K , et al. Res2Net: A New Multi-scale Backbone Architecture[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2019, PP(99):1-1.
[3] Buslaev A, Iglovikov V I, Khvedchenya E, et al. Albumentations: fast and flexible image augmentations[J]. Information, 2020, 11(2): 125.
[4] Singh B, Davis L S. An analysis of scale invariance in object detection snip[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2018: 3578-3587.
[5] Dai J , Qi H , Xiong Y , et al. Deformable Convolutional Networks[J]. 2017.
[6] Bodla N, Singh B, Chellappa R, et al. Improving object detection with one line of code. CoRR (2017)[J]. arXiv preprint arXiv:1704.04503.
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統(tǒng)計學習方法》的代碼復現(xiàn)專輯 AI基礎下載機器學習的數(shù)學基礎專輯 本站知識星球“黃博的機器學習圈子”(92416895) 本站qq群704220115。 加入微信群請掃碼:總結
以上是生活随笔為你收集整理的【数据竞赛】2020首届海洋目标智能感知国际挑战赛冠军方案分享的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: win7系统如何清理系统日志
- 下一篇: Win7电脑快速获取超级管理员权限的方法