當(dāng)前位置：首頁 > 编程资源 > 综合教程 >内容正文

综合教程

机器学习--如何理解Accuracy, Precision, Recall, F1 score

發(fā)布時間：2023/12/13 综合教程 50 生活家

生活随笔收集整理的這篇文章主要介紹了机器学习--如何理解Accuracy, Precision, Recall, F1 score 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

當(dāng)我們在談?wù)撘粋€模型好壞的時候，我們常常會聽到準(zhǔn)確率(Accuracy)這個詞，我們也會聽到＂如何才能使模型的Accurcy更高＂．那么是不是準(zhǔn)確率最高的模型就一定是最好的模型？

這篇博文會向大家解釋準(zhǔn)確率并不是衡量模型好壞的唯一指標(biāo)，同時我也會對其他衡量指標(biāo)做出一些簡單說明。

首先我們先要了解混淆矩陣(Confusion Matrix),　如下圖，混淆矩陣經(jīng)常被用來衡量一個分類模型在測試樣本上的性能，本文提到的所有衡量標(biāo)準(zhǔn)都會用到下面混淆矩陣中出現(xiàn)的的四個值

真正例和真反例表示被正確預(yù)測的數(shù)據(jù)，假正例和假反例表示被錯誤預(yù)測的數(shù)據(jù)，接下來的內(nèi)容基本都是圍繞著四個值展開，因此我們有必要在這里弄清楚這四個值的含義是什么．

TP(True Positive)－被正確預(yù)測的正例．表示真實(shí)值為正，同時也被正確的預(yù)測為正；

TN(True Negative)－被正確預(yù)測的反例．表示真實(shí)值為反例，也被正確的預(yù)測為反例；

FP(False Positive)－表示真實(shí)值為負(fù)例，被錯誤的預(yù)測為正例；

FN(False Negative)－表示真實(shí)值為正例，被錯誤的預(yù)測為反例；

在了解了這四個值之后讓我們來計算接下來的Accuracy, Precision, Recall, F1 Score

Accuracy

Accuracy是最直觀的衡量模型好壞的指標(biāo)，它實(shí)際上是被正確預(yù)測的數(shù)據(jù)量比上所有參與預(yù)測的數(shù)據(jù)量的值。正如我開篇提到的，有人會認(rèn)為如果我們的模型具有很高的Accuracy，那么我們的模型是最好的。

首先要明確只有當(dāng)我們擁有一個對稱數(shù)據(jù)集時，也就是假陽性和假陰性的值幾乎相同時，Accuracy才可以被用來作為一個很好的衡量標(biāo)準(zhǔn)。因此，我們必須查看其他參數(shù)才能完整地評估模型的性能。

Precision and Recall

有人翻譯他們?yōu)榫_率和召回率，我更喜歡用查準(zhǔn)率和查全率來翻譯這兩個詞．　　　　　　　　　　　　　　　　　　　　　　　　

查準(zhǔn)率P就表示在預(yù)測結(jié)果為正例的樣本里，真實(shí)情況也為正例所占的比率

適用場景:當(dāng)反例被錯誤的預(yù)測為正例（假正例）產(chǎn)生的代價很高的時候，適合用查準(zhǔn)率，因?yàn)楦卟闇?zhǔn)率意味著低假正率/假陽性．比如在垃圾郵件檢測中，假正例意味著非垃圾郵件（實(shí)際為負(fù)）被錯誤的預(yù)測為垃圾郵件（預(yù)測為正）．如果一個垃圾郵件監(jiān)測系統(tǒng)的查準(zhǔn)率不高導(dǎo)致很多非垃圾郵件被歸到垃圾郵箱里去，那么郵箱用戶可能會丟失或者漏看一些很重要的郵件．

查全率R表示在真實(shí)情況為正例的所有樣本中，預(yù)測結(jié)果也為正例的樣本所占的比率

使用場景:當(dāng)正例被錯誤的預(yù)測為反例（假反例）產(chǎn)生很高的代價時，用查全率，因?yàn)楦卟槿室馕吨图俜绰?假陰性．比如說在銀行的欺詐檢測或醫(yī)院的病患者檢測中，如果將欺詐性交易（實(shí)際為正）預(yù)測為非欺詐性交易（預(yù)測為負(fù)），則可能會給銀行帶來非常嚴(yán)重的損失。再比如以最近的新冠疫情為例，如果一個患病者（實(shí)際為正）經(jīng)過試劑檢測被預(yù)測為沒有患病（預(yù)測為負(fù)），這樣的假反例或者說假陰性產(chǎn)生的風(fēng)險就非常大．

F1 Score

F1是查準(zhǔn)率和查全率的一個加權(quán)平均，根據(jù)wikipedia給出的解釋，F(xiàn)1 Score表達(dá)式如下

F1把假反例和假正例都考慮在內(nèi)，它不像Accuracy這么容易理解，但是F1比Accuracy更適用，尤其是當(dāng)你的數(shù)據(jù)集類別分布不均衡時．比如說你的樣本中正樣本:負(fù)樣本 = 100:1.

當(dāng)假正例和假反例造成的代價差不多的時候直接用Accuracy就可以，但是當(dāng)假正例和假反例產(chǎn)生的代價差別很大的時候，則可以考率更好的度量比如Precision，Recall和F1 Score.

reference :Accuracy, Precision, Recall & F1 Score: Interpretation of Performance Measures

Accuracy, Precision, Recall or F1?

總結(jié)

以上是生活随笔為你收集整理的机器学习--如何理解Accuracy, Precision, Recall, F1 score的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

综合教程

机器学习--如何理解Accuracy, Precision, Recall, F1 score

總結(jié)