日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪(fǎng)問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

分类模型的性能评估——以SAS Logistic回归为例(2): ROC和AUC

發(fā)布時(shí)間:2025/3/21 编程问答 18 豆豆
生活随笔 收集整理的這篇文章主要介紹了 分类模型的性能评估——以SAS Logistic回归为例(2): ROC和AUC 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

ROC

上回我們提到,ROC曲線(xiàn)就是不同的閾值下,以下兩個(gè)變量的組合(如果對(duì)Sensitivity和Specificity兩個(gè)術(shù)語(yǔ)沒(méi)有概念,不妨返回,《分類(lèi)模型的性能評(píng)估——以SAS Logistic回歸為例(1): 混淆矩陣》,強(qiáng)烈建議讀者對(duì)著看):

Sensitivity(覆蓋率,True Positive Rate)

1-Specificity (Specificity, 負(fù)例的覆蓋率,True Negative Rate)

二話(huà)不說(shuō),先把它畫(huà)出來(lái)(以下腳本的主體是標(biāo)紅部分,數(shù)據(jù)集valid_roc,還是出自上面提到的那篇):

axis order=(0 to 1 by .1) label=none length=4in;

symbol i=join v=none c=black;

symbol2 i=join v=none c=black;

proc gplot data = valid_roc;

plot _SENSIT_*_1MSPEC_ _1MSPEC_*_1MSPEC_

/ overlay vaxis=axis haxis=axis;

run; quit;

上圖那條曲線(xiàn)就是ROC曲線(xiàn),橫軸是1-Specificity,縱軸是Sensitivity。以前提到過(guò),隨著閾值的減小(更多的客戶(hù)就會(huì)被歸為正例),Sensitivity和1-Specificity也相應(yīng)增加(也即Specificity相應(yīng)減少),所以ROC呈遞增態(tài)勢(shì)(至于ROC曲線(xiàn)凹向原點(diǎn)而非凸向原點(diǎn),不知道有無(wú)直觀(guān)的解釋,不提)。那條45度線(xiàn)是作為參照(baseline model)出現(xiàn)的,就是說(shuō),ROC的好壞,乃是跟45度線(xiàn)相比的,怎么講?

回到以前,我們分析valid數(shù)據(jù),知道有36.5%的bad客戶(hù)(Actual Positive )和63.5%的good客戶(hù)(Actual Negative)。這兩個(gè)概率是根據(jù)以往的數(shù)據(jù)計(jì)算出來(lái)的,可以叫做“先驗(yàn)概率”( prior probability)。后來(lái),我們用logistic回歸模型,再給每個(gè)客戶(hù)算了一個(gè)bad的概率,這個(gè)概率是用模型加以修正的概率,叫做“后驗(yàn)概率”(Posterior Probability)。

??預(yù)測(cè)??
??10?
實(shí)1d, True Positivec, False Negativec+d, Actual Positive
0b, False Positivea, True Negativea+b, Actual Negative
??b+d, Predicted Positivea+c, Predicted Negative?

如果不用模型,我們就根據(jù)原始數(shù)據(jù)的分布來(lái)指派,隨機(jī)地把客戶(hù)歸為某個(gè)類(lèi)別,那么,你得到的True Positive對(duì)False Positive之比,應(yīng)該等于A(yíng)ctual Positive對(duì)Actual Negative之比(你做得跟樣本分布一樣好)——即,d/b=(c+d)/(a+b),可以有(d/c+d)/(b/a+b)=1,而這正好是Sensitivity/(1-Specificity)。在不使用模型的情況下,Sensitivity和1-Specificity之比恒等于1,這就是45度線(xiàn)的來(lái)歷。一個(gè)模型要有所提升,首先就應(yīng)該比這個(gè)baseline表現(xiàn)要好。ROC曲線(xiàn)就是來(lái)評(píng)估模型比baseline好壞的一個(gè)著名圖例。這個(gè)可能不夠直觀(guān),但可以想想線(xiàn)性回歸的baseline model:

如果不用模型,對(duì)因變量的最好估計(jì)就是樣本的均值(上圖水平紅線(xiàn))。綠線(xiàn)是回歸線(xiàn)(模型),回歸線(xiàn)與水平線(xiàn)之間的偏離,稱(chēng)作Explained Variability, 就是由模型解釋了的變動(dòng),這個(gè)變動(dòng)(在方差分析里,又稱(chēng)作model sum of squares, SSM)越大,模型表現(xiàn)就越好了(決定系數(shù)R-square標(biāo)準(zhǔn))。同樣的類(lèi)比,ROC曲線(xiàn)與45度線(xiàn)偏離越大,模型的效果就越好。最好好到什么程度呢?

在最好的情況下,Sensitivity為1(正確預(yù)測(cè)到的正例就剛好等于實(shí)際的正例總數(shù)),同時(shí)Specificity為1(正確預(yù)測(cè)到的負(fù)例個(gè)數(shù)就剛好等于實(shí)際的負(fù)例數(shù)),在上圖中,就是左上方的點(diǎn)(0,1)。因此,ROC曲線(xiàn)越往左上方靠攏,Sensitivity和Specificity就越大,模型的預(yù)測(cè)效果就越好。同樣的思路,你還可以解釋為什么ROC曲線(xiàn)經(jīng)過(guò)點(diǎn)(0,0)和(1.1),不提。

AUC, Area Under the ROC Curve

ROC曲線(xiàn)是根據(jù)與45度線(xiàn)的偏離來(lái)判斷模型好壞。圖示的好處是直觀(guān),不足就是不夠精確。到底好在哪里,好了多少?這就要涉及另一個(gè)術(shù)語(yǔ),AUC(Area Under the ROC Curve,ROC曲線(xiàn)下的面積),不過(guò)也不是新東西,只是ROC的一個(gè)派生而已。

回到先前那張ROC曲線(xiàn)圖。45度線(xiàn)下的面積是0.5,ROC曲線(xiàn)與它偏離越大,ROC曲線(xiàn)就越向左上方靠攏,它下面的面積(AUC)也就應(yīng)該越大。我們就可以根據(jù)AUC的值與0.5相比,來(lái)評(píng)估一個(gè)分類(lèi)模型的預(yù)測(cè)效果。

SAS的Logistic回歸能夠后直接生成AUC值。跑完上面的模型,你可以在結(jié)果報(bào)告的Association Statistics找到一個(gè)叫c的指標(biāo),它就是AUC(本例中,c=AUC=0.803,45度線(xiàn)的c=0.5)。

/*注:以上提到的c不是AUC里面那個(gè)’C’。這個(gè)c是一個(gè)叫Wilcoxon-Mann-Whitney 檢驗(yàn)的統(tǒng)計(jì)量。這個(gè)說(shuō)來(lái)話(huà)長(zhǎng),不過(guò)這個(gè)c卻等價(jià)于ROC曲線(xiàn)下的面積(AUC)。*/

ROC、AUC:SAS9.2一步到位

SAS9.2有個(gè)非常好的新功能,叫ODS Statistical Graphics,有興趣可以去它主頁(yè)看看。在SAS9.2平臺(tái)提交以下代碼,Logistic回歸參數(shù)估計(jì)和ROC曲線(xiàn)、AUC值等結(jié)果就能一起出來(lái)(有了上面的鋪墊,就不懼這個(gè)黑箱了):

ods graphics on;

proc logistic data=train plots(only)=roc;

model good_bad=checking history duration savings property;

run;

ods graphics off;

這個(gè)ROC圖貌似還漂亮些,眼神好能看見(jiàn)標(biāo)出來(lái)的AUC是0.8029。 最后提一句,ROC全稱(chēng)是Receiver Operating Characteristic Curve,中文叫“接受者操作特性曲線(xiàn)”,江湖黑話(huà)了(有朋友能不能出來(lái)解釋一下,誰(shuí)是Receiver,為什么Operating,何謂Characteristic——這個(gè)看著好像是Sensitivity和Specificity),不過(guò)并不妨礙我們使用ROC作為模型評(píng)估的工具。

下期預(yù)告:Lift和Gain

不多說(shuō),只提一句,跟ROC類(lèi)似,Lift(提升)和Gain(增益)也一樣能簡(jiǎn)單地從以前的Confusion Matrix以及Sensitivity、Specificity等信息中推導(dǎo)而來(lái),也有跟一個(gè)baseline model的比較,然后也是很容易畫(huà)出來(lái),很容易解釋。

參考資料

  • Mithat Gonen. 2007. Analyzing Receiver Operating Characteristic Curves with SAS. Cary, NC: SAS Institute Inc.
  • Mike Patetta. 2008. Categorical Data Analysis Using Logistic Regression Course Notes. Cary, NC: SAS Institute Inc.
  • Dan Kelly, etc. 2007. Predictive Modeling Using Logistic Regression Course Notes. Cary, NC: SAS Institute Inc.
  • Receiver operating characteristic, see http://en.wikipedia.org/wiki/Receiver_operating_characteristic
  • The magnificent ROC, see http://www.anaesthetist.com/mnm/stats/roc/Findex.htm
  • from: http://cos.name/2008/12/measure-classification-model-performance-roc-auc/

    總結(jié)

    以上是生活随笔為你收集整理的分类模型的性能评估——以SAS Logistic回归为例(2): ROC和AUC的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

    如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 日韩免费小视频 | 性农村xxxxx小树林 | 国产爆乳无码一区二区麻豆 | 四虎啪啪 | 无码人妻一区二区三区在线视频 | 国产亚洲精品女人久久久久久 | 婷婷色图 | 女人又爽又黄免费女仆 | 婷婷色中文 | 亚洲精品久久久久久久久久久 | 首尔之春在线观看 | 日本丰满少妇做爰爽爽 | av网站在线观看不卡 | 国产视频久久久久久久 | 欧美日韩国产免费一区二区三区 | 黄色片在线播放 | 影音先锋中文字幕在线播放 | 国产xx视频| 三上悠亚影音先锋 | 欧美日韩人妻精品一区 | 精品国产欧美一区二区三区成人 | 黄色aa大片 | 国产三级三级三级 | 国产欧美一区二区三区在线看 | 看国产黄色片 | 欧美大片免费高清观看 | 超碰成人在线观看 | av男人在线| 亚洲iv一区二区三区 | 亚洲一级Av无码毛片久久精品 | 日韩一区二区视频 | 亚洲人成在线观看 | 97碰| 美女写真福利视频 | 国产日本在线观看 | 日韩精品免费一区 | 亚洲专区在线视频 | 日韩a在线 | 国产嫩草影视 | 999视频在线播放 | 无码人妻丰满熟妇区毛片18 | 天天色天天射天天操 | 国产精品成av人在线视午夜片 | 亚洲性网 | 人人97| ass亚洲熟妇毛耸耸pics | 久久精品亚洲一区 | 欧美三级免费 | 亚洲成熟少妇视频在线观看 | 涩里番在线观看 | 欧美日韩国产一级片 | 色天使亚洲 | 午夜亚洲福利在线老司机 | 女人一级一片30分 | 午夜肉伦伦| 亚洲天堂一区 | 伊人夜色| 亚洲免费久久 | 久久国产一区二区三区 | 级毛片内射视频 | 久久久久女人精品毛片九一 | 3d动漫精品啪啪一区二区竹菊 | 日韩人妻精品一区二区三区 | 日韩精品视频一区二区在线观看 | 久久精品欧美一区二区 | 国产日韩欧美在线观看 | 成人在线免费小视频 | 精品无码国产av一区二区三区 | 40到50岁中老年妇女毛片 | 色婷婷综合久久久久中文字幕 | 看av网| 免费大片黄在线观看 | 无码人妻精品一区二区三 | 香蕉在线影院 | 91亚洲国产成人精品性色 | 双乳被四个男人吃奶h文 | 亚洲视频在线观看免费 | 国产日韩精品电影 | jiz亚洲| 打美女屁股网站 | 97人妻精品一区二区三区免费 | 九月丁香婷婷 | 中文字幕一区二区三区乱码在线 | julia一区二区中文久久97 | 日韩激情久久 | 亚洲一本之道 | 国产乱叫456在线 | 国产激情毛片 | 国产精品社区 | 亚洲一区二区三区日韩 | 午夜影院免费 | 成人免费影院 | 欧美一级免费在线观看 | 中文字幕一区二区久久人妻网站 | 夜夜操免费视频 | 加勒比hezyo黑人专区 | 高潮毛片又色又爽免费 | 我把护士日出水了视频90分钟 | 国产偷亚洲偷欧美偷精品 |