r roc函数_一棵树专栏 | ROC分析时一定要告诉R分析谁
用到的軟件是:R語言
用到的R包是:pROC和ROCit1. 安裝R包
install.packages('pROC')
install.packages('ROCit')
score1=c(0.830410619,0.455829518,0.058478492,0.729325234,0.831480755,0.134660431,0.695320049,0.662420877,0.528904992,0.371757106,0.87803265,0.705919705,0.740182936,0.060545256,0.891066853,0.568020037,0.379067286)
score2=c(0.376703255,0.694968207,0.066650344,0.261298118,0.079832816,0.005758134,0.433320986,0.211177625,0.68847034,0.085216767,0.452439458,0.054711128,0.719909102,0.653851262,0.500626397,0.380789783,0.430002115)
class=c(1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0)
pROC::roc(predictor?=?score1,response?=?class)##?Setting?levels:?control?=?0,?case?=?1##?Setting?direction:?controls?####?Call:##?roc.default(response?=?class,?predictor?=?score1)####?Data:?score1?in?10?controls?(class?0)?##?Area?under?the?curve:?0.4714
使用ROCit包ROCit::rocit(score?=?score1,class?=?class)$AUC##?[1]?0.4714286
兩個包的AUC結果一致,都是0.4714。這種做法也是我們常規的做法。4. 不一致的ROC分析結果奇怪的事情馬上就要發生了!現在,我們再對score2和class做ROC分析,看一下他們的AUC。使用pROC包
pROC::roc(predictor?=?score2,response?=?class)##?Setting?levels:?control?=?0,?case?=?1##?Setting?direction:?controls?>?cases####?Call:##?roc.default(response?=?class,?predictor?=?score2)####?Data:?score2?in?10?controls?(class?0)?>?7?cases?(class?1).##?Area?under?the?curve:?0.6857
使用ROCit包ROCit::rocit(score?=?score2,class?=?class)$AUC##?[1]?0.3142857
這個時候pROC包計算的AUC是0.6857,而ROCit包計算的結果是0.3142,兩個差別很大啊。這是咋回事?相同的命令,換個數據結果就不一樣了?5. 為什么2個包的結果會矛盾我們再回頭看,使用pROC包分析score1和class時,有這樣一段提示##?Setting?direction:?controls?
同樣使用pROC包分析score2和class時,也有這樣一段提示
##?Setting?direction:?controls?>?cases
同樣的class,兩次計算的方向竟然不同,第一次是controls < cases,而第二次是controls > cases,這個是什么意思呢?controls < cases:表示controls組的中位數小于cases組的中位數,pROC包對cases組進行ROC分析,計算cases組的AUC。controls > cases:表示controls組的中位數大于cases組的中位數,pROC包對controls組進行ROC分析,計算controls組的AUC。
我們先來看一下score1在class兩組的中位數。
c(controls=median(score1[class==0]),
?cases=median(score1[class==1]))##??controls?????cases##?0.6152205?0.6953200
再來看一下score2在class兩組的中位數。
c(controls=median(score2[class==0]),
?cases=median(score2[class==1]))##??controls?????cases##?0.4412208?0.2612981
很多時候,我們進行ROC分析時,默認都是去計算class=1那組,也就是陽性組的AUC,而class=0,被我們默認當成了陰性組,也就是參考組。在ROCit包中就是這樣的,但是在大名鼎鼎的pROC包中,ROC分析的依據卻是中位數的大小。這一點千萬要注意。
如果你用pROC包做ROC分析,那么接下來的AUC和cutoff value都是要注意的,如果你不事先設置參考,得到的結果可能就搞不清楚是陰性組的AUC還是陽性組的AUC,僅僅是中位數高的那組的AUC,而你默認都是當成陽性組的AUC。千萬要注意這一點!7. 告訴R去ROC誰在pROC::roc()函數中,有2個參數是需要我們設置的levels和direction,levels表示結局變量中的數值水平,direction的值是大于號>或小于號
現在我們給levels賦值0和1,direction賦值小于號
pROC::roc(predictor?=?score2,response?=?class,
?????????levels?=?c(0,1),
?????????direction=')####?Call:##?roc.default(response?=?class,?predictor?=?score2,?levels?=?c(0,?????1),?direction?=?"####?Data:?score2?in?10?controls?(class?0)?##?Area?under?the?curve:?0.3143
這個時候得到結果0.314,和ROCit包的結果一致了。
在ROCit::rocit()函數中,我們通過給negref參數賦值0,設置ROC分析的陰性參考。
ROCit::rocit(score?=?score2,class?=?class,1
????????????negref?=?0)$AUC##?[1]?0.3142857
ROC分析函數,不提供設置參考的參數,可以考慮丟棄了!快,關注這個公眾號,一起漲姿勢~
總結
以上是生活随笔為你收集整理的r roc函数_一棵树专栏 | ROC分析时一定要告诉R分析谁的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: idea本地跑如何看gc日志_牛逼了!用
- 下一篇: egg风格 什么意思_小小的“egg”,