日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

ISIC2018比赛经验分享

發布時間:2024/3/13 编程问答 68 豆豆
生活随笔 收集整理的這篇文章主要介紹了 ISIC2018比赛经验分享 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

ISIC2018皮膚病分類比賽分享


比賽概況

2018年5月到7月28號,我們實驗室(我們實驗室的網址,歡迎加入我們實驗室~)參與了由醫學圖像頂級會議MICCAI組織的2018 ISIC皮膚病理圖像分割和分類比賽(比賽網址)。其中我和另外一個同學是參與了分類比賽,在最終的排行榜上取得了第三名的成績(這個比賽每只隊伍可以提交3個answer, 前三個answer是一只隊伍。下面的第五名以及后續的第六名都是我們提交的結果。和前兩名的差距個人感覺主要是在數據方面(╯﹏╰)。

分類比賽簡介

這個比賽前期只給了訓練集,訓練集有10015張皮膚病理圖像,有七類。每一類的名稱和數量如下表格所示

疾病名稱圖像數量
MEL1113
NV6705
BCC514
AKIEC327
BKL1099
DF115
VASC142

此外,每一張圖片都是600x450的尺寸三通道RGB圖像。圖像的label由一個groundtruth的csv文件提供。

比賽的難點

1.類別不均衡:圖片數量最少的兩類只有100多張圖片,數量最多的一類多達6000張。
2.疾病區域大小不同:在某些圖片中疾病的區域很小,而在某些圖片中疾病占滿了整張圖片。

Baseline Model

1.由于只有訓練集圖片和label,所以我們將訓練集進行five-fold交叉驗證。但是在整個測試idea過程中,由于實驗室可用GPU數量限制,我們只是在其中一個劃分上進行test。而那個劃分正好是五個劃分中,不同模型都在上面準確率最低的一個劃分。
2.整個比賽中我們使用的Baseline模型有不同層數的Resnet、Densenet、SENet、PNASNet等。整體來看,名次比我們差的隊伍通常只用了Resnet或者Densenet2333…事實證明一個好的模型(說的就是SENet, PNASNet)在這種比賽中會占據極大的優勢。

比賽心得

color constancy

首先我們閱讀了往年參加ISIC比賽,并且取得較好名次的arxiv文章。發現他們通常會使用color constancy(色彩恒常性)的幾種算法來進行預處理,即將原始數據集的所有圖片換成經過color constancy算法處理過的圖片。這個部分是由我們實驗室另外一個同學實現的,我們主要是用他實現好的算法處理過后的圖片。

imbalance

  • 這個分類比賽最重要的難點就是類別不均衡,比賽官方采用Mean class accuracy來進行排名。這意味著當模型判斷不準一個圖片只是簡單把它認為它屬于數量最多的那一類,因為這樣雖然會使模型在整個測試集上準確率很高,但是在較少數量類上的準確率會很低,進而導致Mean class accuracy(MCA)很低。
  • 通常在分類任務中解決類別不均衡的一個方法就是修改loss function,pytorch可以很方便地修改loss function使其加上class weight。在我們的實驗中發現加入class weight是一個非常有效的方法。
  • 為了解決樣本不均衡,我們嘗試了其他很多種方法比如不使用class weight使用Focal Loss論文地址來作為模型的Loss function, 經過多個模型的測試發現相比class weight,Focal loss可以使整個模型在不同epoch時模型在測試集的準確率波動較小,但是峰值比不過class weight的結果。
  • 其次我們還嘗試了一些其他的idea,比如Multiscale,將不同尺寸的圖片送入網絡進行分類,將預測結果結合起來,這個會有一定的效果。
  • 總結

    以上是生活随笔為你收集整理的ISIC2018比赛经验分享的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。