日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

机器学习二分类模型评价指标:准确率召回率特异度等

發布時間:2023/12/13 综合教程 37 生活家
生活随笔 收集整理的這篇文章主要介紹了 机器学习二分类模型评价指标:准确率召回率特异度等 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

混淆矩陣是一種用于性能評估的方便工具,它是一個方陣,里面的列和行存放的是樣本的實際類vs預測類的數量。

P =陽性,N =陰性:指的是預測結果。

T=真,F=假:表示 實際結果與預測結果是否一致,一致為真,不一致為假。

TP=真陽性:預測結果為P,且實際與預測一致。

FP=假陽性:預測結果為P,但與實際不一致。

TN=真陰性:預測結果為N,且與實際一致。

FN=假陰性:預測結果為N,但與實際不一致。

分類模型的經驗誤差可以通過計算1-準確率得到。

然而,如何選擇一個適當的預測誤差度量是高度依賴于具體問題的。在“垃圾郵件”分類的情況中,我們更加關注的是低誤報率。當然,垃圾郵件被分成了火腿肯定是煩人的,但不是那么糟糕。要是一封郵件被誤分為垃圾郵件,而導致重要信息丟失,那才是更糟糕的呢。

在如“垃圾郵件”分類的二元分類問題中,有一種方便的方式來調整分類器,稱為接受者操作特性(ROC或ROC曲線)。該曲線對應精密性Precision,對應著預測值為陽性的數據中正確的比例。

AUC的含義:ROC曲線下的面積(越大越好,1為理想狀態)

ROC(Receiver Operating Characteristic)


準確率Accuracy

正確分類的樣本占總樣本的比例,對總體準確率的評估。

公式:(TP+TN)/(P+N)。即,對陽性和陰性,總體(分母P+N)預測對了多少(分子TP+TN)。

注:準確率是我們最常見的評價指標,而且很容易理解,就是被分對的樣本數除以所有的樣本數,通常來說,正確率越高,分類器越好。
準確率確實是一個很好很直觀的評價指標,但是有時候準確率高并不能代表一個算法就好。比如某個地區某天地震的預測,假設我們有一堆的特征作為地震分類的屬性,類別只有兩個:0:不發生地震、1:發生地震。一個不加思考的分類器,對每一個測試用例都將類別劃分為0,那那么它就可能達到99%的準確率,但真的地震來臨時,這個分類器毫無察覺,這個分類帶來的損失是巨大的。為什么99%的準確率的分類器卻不是我們想要的,因為這里數據分布不均衡,類別1的數據太少,完全錯分類別1依然可以達到很高的準確率卻忽視了我們關注的東西。再舉個例子說明下。在正負樣本不平衡的情況下,準確率這個評價指標有很大的缺陷。比如在互聯網廣告里面,點擊的數量是很少的,一般只有千分之幾,如果用acc,即使全部預測成負類(不點擊)acc也有 99% 以上,沒有意義。因此,單純靠準確率來評價一個算法模型是遠遠不夠科學全面的。

錯誤率(Error rate)

錯誤率則與準確率相反,描述被分類器錯分的比例,error rate = (FP+FN)/(TP+TN+FP+FN),對某一個實例來說,分對與分錯是互斥事件,所以accuracy =1 - error rate。

靈敏度Sensitivity(查全率/召回率Recall)

對“真陽性率”預測的評估,也就是對“陽性/真”預測準確的概率(比如,當試圖預測某種疾病的時候,如果一個病人長了這種病,那么正確的預測出這個人長了這種病,就是“陽性/真”)。

查全率關心的是”預測出正例的保證性”即從正例中挑選出正例的問題。

靈敏度表示的是所有正例中被分對的比例,衡量了分類器對正例的識別能力。召回率是覆蓋面的度量,度量有多個正例被分為正例,與靈敏度相等。

公式:TP/(TP+FN)。即,實際為陽性P(分母TP+FN),其中預測正確的比例(分子TP)。

精密性(精確率/精度/查準率)Precision

對“真陽性率”預測的評估。

查準率關心的是”預測出正例的正確率”即從正反例子中挑選出正例的問題。

表示被分為正例的示例中實際為正例的比例。

公式:TP/(TP+FP)。即,預測為陽性的數據(分母TP+FP)中,實際對了多少(分子TP)。

特異性Specificity

描述了二元分類問題中的“真陰性率”:這指的是對“真/陰性”情況作出正確預測的概率(例如,在試圖預測疾病時,對一個健康者,沒有預測到疾病,就是這種情況)。

表示的是所有負例中被分對的比例,衡量了分類器對負例的識別能力。

公式:TN/(TN+FP)。即,實際為陰性N(分母TN+FP),其中預測正確的比例(分子TN)。

綜合評價指標(F-Measure)

靈敏度Sensitivity(查全率/召回率Recall)精密性(精確率、精度)Precision這兩個指標有時候會出現的矛盾的情況,這樣就需要綜合考慮他們,最常見的方法就是F-Measure(又稱為F-Score)。兩者一般存在矛盾關系,不能都達到很高的值,所以定義F-score評價綜合標準。如下圖,查準率-查全率曲線(P-R圖):

F-Measure是Precision(P)和Recall(R)加權調和平均:

當參數α=1時,就是最常見的F1,也即

可知F1綜合了P和R的結果,當F1較高時則能說明試驗方法比較有效。


其他評價指標

計算速度:分類器訓練和預測需要的時間;

魯棒性:處理缺失值和異常值的能力;

可擴展性:處理大數據集的能力;

可解釋性:分類器的預測標準的可理解性,像決策樹產生的規則就是很容易理解的,而神經網絡的一堆參數就不好理解,我們只好把它看成一個黑盒子。

總結

以上是生活随笔為你收集整理的机器学习二分类模型评价指标:准确率召回率特异度等的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 狠狠97| 人妻精品久久久久中文字幕69 | 日韩在线国产精品 | 精品视频入口 | 欧美一级二级三级视频 | 熟妇大屁股一区二区三区视频 | 91在线视频精品 | 日韩中出 | 欧美最猛性xxxx | 香蕉视频成人在线观看 | 涩涩在线播放 | 暴力调教一区二区三区 | 老熟妇一区二区三区 | 波多在线视频 | 免费国产91| 久草福利网 | 国产男男网站 | 漂亮人妻被中出中文字幕 | 日本激情在线 | 乱色精品无码一区二区国产盗 | 在线碰| 国产女人高潮的av毛片 | 91人人草 | 无码人妻aⅴ一区二区三区有奶水 | 一级在线免费观看 | 精品无码三级在线观看视频 | 五月伊人网 | 强公把我次次高潮hd | 久久久久久久国产精品美女 | 国产xx在线观看 | 修仙淫交(高h)h文 | 国产欧美精品一区二区在线播放 | 欧美日韩四区 | 中国zzji女人高潮免费 | 国产三区av| 日本丰满肉感bbwbbwbbw | 国产精品无码午夜福利 | 精品欧美一区二区精品少妇 | 国产 xxxx | 伊人免费在线观看高清版 | 狠狠干很很操 | 五月涩| 国产精品扒开腿做爽爽爽a片唱戏 | 色狗网站 | 五月婷婷视频在线观看 | 亚洲成年人专区 | a级国产视频 | 久一视频在线观看 | 国产精品久久..4399 | 麻豆视频传媒入口 | a级全黄| 久久久久无码国产精品一区 | 中文字幕第35页 | 青青青青青草 | 亚洲成人aaa | 精品在线免费观看 | 后入内射欧美99二区视频 | 亚洲一级中文字幕 | 国产欧美三级 | 午夜小视频免费 | 欧美乱大交xxxxx | 亚洲图片在线播放 | 欧美在线视频网 | 亚州av影院| 天天综合欧美 | 天天插夜夜操 | 国产不卡视频在线播放 | 久久视频精品在线 | 嫩模一区二区三区 | 成人福利视频在线观看 | 欧美三级一区二区三区 | 久久视频一区二区 | 久久国产精品无码一区二区 | 99精品欧美一区二区 | 久久久久久久久久久久电影 | 亚洲专区在线 | 夫妻精品| 国产色网 | 午夜精品一区二区三 | 国产男女自拍 | 国产xxxx在线观看 | 男女激情网站 | 蜜桃91麻豆精品一二三区 | 成人免费黄色网址 | 欧美一区二区三区久久综合 | 中文字幕无码不卡免费视频 | 免费欧美大片 | 国产精品成人va在线观看 | 蜜乳av一区二区 | 成人在线亚洲 | 青青草小视频 | 在线天堂在线 | 精品久久久久久久久久久久 | 久久免费视频1 | 免费a在线观看 | 777色婷婷| 制服丝袜在线一区 | 日韩美女中文字幕 | 看毛片网|