科普 | 一文完全理解AUC-ROC曲线
來(lái)源:https://towardsdatascience.com/understanding-auc-roc-curve-68b2303cc9c5
翻譯:石頭
機(jī)器學(xué)習(xí)模型的性能測(cè)量是一項(xiàng)必不可少的工作,因此,當(dāng)涉及到分類問(wèn)題時(shí),我們可以考慮用AUC-ROC曲線?。當(dāng)我們需要檢查或可視化多分類問(wèn)題的性能時(shí),我們使用ROC曲線下的面積(AUC),它是檢驗(yàn)任何分類模型性能最重要的評(píng)估指標(biāo)之一。
本文旨在回答以下問(wèn)題:
1. 什么是AUC-ROC曲線 ?
2. 定義AUC和ROC曲線中使用的術(shù)語(yǔ)
3. 如何推測(cè)分類模型的性能 ?
4. 靈敏度、特異度、FPR與閾值的關(guān)系
5. 如何將AUC-ROC曲線用于多分類模型
1.?什么是AUC-ROC曲線
AUC-ROC曲線是在不同閾值設(shè)置的條件下,分類問(wèn)題的性能度量。ROC的含義為概率曲線,AUC的含義為正負(fù)類可正確分類的程度。它告訴模型能夠在多大程度上區(qū)分類,AUC越高,模型越能預(yù)測(cè)0為0和1為1。類比疾病診斷模型,若AUC越高,模型對(duì)有疾病和無(wú)疾病的區(qū)分就越好。
ROC曲線由TPR與FPR作圖,其中TPR是y軸,FPR是x軸。如下圖:
2.?AUC-ROC曲線的術(shù)語(yǔ)定義
真陽(yáng)率(TPR)/召回率(Recall)/敏感度(Sensitivity):
特異度(Specificity)
假陽(yáng)率(FPR)
3. 如何推測(cè)分類模型的性能
一個(gè)優(yōu)秀的模型AUC接近于1,這意味著它具有良好的可分性。一個(gè)差模型的AUC接近于0,意味著它的可分性最差,意味著模型預(yù)測(cè)0是1,1是0。當(dāng)AUC為0.5時(shí),表示模型沒(méi)有任何的分類能力,意味這隨機(jī)給出分類結(jié)果。
讓我們來(lái)解釋以下上面的陳述。
我們知道,ROC是概率曲線,我們畫(huà)出這些概率的分布,
備注:紅色分布曲線為正類(有疾病者),綠色分布曲線為負(fù)類(無(wú)疾病者)。
如上圖為正類和負(fù)類的分布,我們根據(jù)ROC曲線的定義,以閾值為1向0移動(dòng),得到相應(yīng)的TPR和FPR,因此我們根據(jù)上圖可畫(huà)出ROC曲線,ROC曲線下的面積等于1,即AUC=1。
ROC曲線圖如下:
同理,我們根據(jù)下圖的正負(fù)類分布畫(huà)出ROC曲線,AUC = 0.7
當(dāng)正負(fù)類的分布完全相同時(shí),即模型的分類結(jié)果是隨機(jī)給出的,即AUC=0.5,如下圖的正負(fù)類分布和ROC曲線:
AUC=0.5時(shí),模型沒(méi)有區(qū)分正類和負(fù)類的能力,這是最糟糕的情況。
當(dāng)AUC=0時(shí),模型完全預(yù)測(cè)錯(cuò)誤,即負(fù)類預(yù)測(cè)為正類,正類預(yù)測(cè)為負(fù)類。
4. 敏感度(Sensitivity)、特異度(Specificity)、FPR與閾值(Threshold)的關(guān)系
敏感度和特異度成反比,當(dāng)我們?cè)黾用舾卸葧r(shí),特異度下降,反之亦然。
解釋:當(dāng)我們降低閾值時(shí),我們的預(yù)測(cè)結(jié)果會(huì)得到更多的正值,從而增加了敏感度,降低了特異度。
同樣地,當(dāng)我們?cè)黾娱撝禃r(shí),我們的預(yù)測(cè)結(jié)果會(huì)得到更多的負(fù)值,從而增加了特異度,降低了靈敏度。
正如我們所知道的,FPR = 1 -?特異度,所以當(dāng)我們?cè)黾覶PR時(shí),FPR也會(huì)增加,反之亦然。
5.?如何將AUC-ROC曲線用于多分類模型
在多分類模型中,我們可以用一種方法繪制N個(gè)類別的AUC-ROC曲線。舉個(gè)例子,如果你有3個(gè)類別,X,Y,Z。你會(huì)繪制出3個(gè)ROC曲線,一個(gè)ROC曲線代表X,對(duì)應(yīng)Y和Z,一個(gè)ROC曲線達(dá)標(biāo)Y,對(duì)應(yīng)X和Z,一個(gè)ROC曲線代表Z,對(duì)應(yīng)Y和X。
往期精彩回顧適合初學(xué)者入門人工智能的路線及資料下載機(jī)器學(xué)習(xí)在線手冊(cè)深度學(xué)習(xí)在線手冊(cè)AI基礎(chǔ)下載(pdf更新到25集)本站qq群1003271085,加入微信群請(qǐng)回復(fù)“加群”獲取一折本站知識(shí)星球優(yōu)惠券,請(qǐng)回復(fù)“知識(shí)星球”喜歡文章,點(diǎn)個(gè)在看
總結(jié)
以上是生活随笔為你收集整理的科普 | 一文完全理解AUC-ROC曲线的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 喜大普奔!Github 移动端上架!
- 下一篇: 【白话机器学习】算法理论+实战之K-Me