當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

ISIC2018比赛经验分享

發布時間：2024/3/13 编程问答 68 豆豆

生活随笔收集整理的這篇文章主要介紹了 ISIC2018比赛经验分享小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

ISIC2018皮膚病分類比賽分享

比賽概況

2018年5月到7月28號，我們實驗室（我們實驗室的網址，歡迎加入我們實驗室～）參與了由醫學圖像頂級會議MICCAI組織的2018 ISIC皮膚病理圖像分割和分類比賽（比賽網址）。其中我和另外一個同學是參與了分類比賽，在最終的排行榜上取得了第三名的成績(這個比賽每只隊伍可以提交3個answer，前三個answer是一只隊伍。下面的第五名以及后續的第六名都是我們提交的結果。和前兩名的差距個人感覺主要是在數據方面(╯﹏╰)。

分類比賽簡介

這個比賽前期只給了訓練集，訓練集有10015張皮膚病理圖像，有七類。每一類的名稱和數量如下表格所示

疾病名稱圖像數量

MEL	1113
NV	6705
BCC	514
AKIEC	327
BKL	1099
DF	115
VASC	142

此外，每一張圖片都是600x450的尺寸三通道RGB圖像。圖像的label由一個groundtruth的csv文件提供。

比賽的難點

1.類別不均衡：圖片數量最少的兩類只有100多張圖片，數量最多的一類多達6000張。
2.疾病區域大小不同：在某些圖片中疾病的區域很小，而在某些圖片中疾病占滿了整張圖片。

Baseline Model

1.由于只有訓練集圖片和label，所以我們將訓練集進行five-fold交叉驗證。但是在整個測試idea過程中，由于實驗室可用GPU數量限制，我們只是在其中一個劃分上進行test。而那個劃分正好是五個劃分中，不同模型都在上面準確率最低的一個劃分。
2.整個比賽中我們使用的Baseline模型有不同層數的Resnet、Densenet、SENet、PNASNet等。整體來看，名次比我們差的隊伍通常只用了Resnet或者Densenet2333…事實證明一個好的模型（說的就是SENet, PNASNet）在這種比賽中會占據極大的優勢。

比賽心得

color constancy

首先我們閱讀了往年參加ISIC比賽，并且取得較好名次的arxiv文章。發現他們通常會使用color constancy（色彩恒常性）的幾種算法來進行預處理，即將原始數據集的所有圖片換成經過color constancy算法處理過的圖片。這個部分是由我們實驗室另外一個同學實現的，我們主要是用他實現好的算法處理過后的圖片。

imbalance

這個分類比賽最重要的難點就是類別不均衡，比賽官方采用Mean class accuracy來進行排名。這意味著當模型判斷不準一個圖片只是簡單把它認為它屬于數量最多的那一類，因為這樣雖然會使模型在整個測試集上準確率很高，但是在較少數量類上的準確率會很低，進而導致Mean class accuracy(MCA)很低。

通常在分類任務中解決類別不均衡的一個方法就是修改loss function，pytorch可以很方便地修改loss function使其加上class weight。在我們的實驗中發現加入class weight是一個非常有效的方法。

為了解決樣本不均衡，我們嘗試了其他很多種方法比如不使用class weight使用Focal Loss論文地址來作為模型的Loss function, 經過多個模型的測試發現相比class weight，Focal loss可以使整個模型在不同epoch時模型在測試集的準確率波動較小，但是峰值比不過class weight的結果。

其次我們還嘗試了一些其他的idea，比如Multiscale，將不同尺寸的圖片送入網絡進行分類，將預測結果結合起來，這個會有一定的效果。

總結

以上是生活随笔為你收集整理的ISIC2018比赛经验分享的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

经验

上一篇：林光常颠覆传统的养生观，养生必读
下一篇： oracle时间相减得到天_oracle