机器学习中的二分类问题评价指标之精确率、召回率、F1值通俗理解
????????引言:對于分類問題,我們在評估一個模型的好壞時,通常想到的是把該模型在測試集上分類結果正確的樣本數量比上測試集的樣本數量的比值結果,即準確率(精確率)作為評價準則。但除此之外,還有精確率和召回率作為二分類問題的評價指標。那么什么時精確率和召回率呢,之前了解過這個概念用到時總是會忘,現在抽出時間對此進行總結。
????????在了解這兩個評價指標之前,我們必須要對模型預測出的結果類型進行定義,這里是對于二分類問題來講的,在二分類問題中,我們把類別定義為正類(Positive)和負類(Negative)。需要記住四個結果類型,分別為TP,FP,TN,FN;
? ? ? ? TP:TP是True Positive,即預測正確的正類樣本數,也就是模型在進行預測的時候,把正類預測為了正類,也就是把正類預測正確了。
????????TN:TN是True Negative,即預測正確的負類樣本數,也就是模型在進行預測的時候,把負類預測為了負類,也就是把負類預測正確了。
? ? ? ? FP:FP是False Positive,即預測錯誤的正類樣本數,也就是模型在進行預測的時候,把負類預測為了正類,也就是把負類預測錯誤了,本來模型該把這個負類預測為負類的,結果卻把這個負類預測為了正類。
? ? ? ? FN:FN是False Negative,即預測錯誤的負類樣本數,也就是模型在進行預測的時候,把正類預測為了負類,也就是把正類預測錯誤了,本來模型該把這個正類預測為正類的,結果卻把這個正類預測為了負類。
? ? ? ? 無外乎,模型給出的預測結果只能是上面四種中的一種,當模型把正類樣本預測為正類(TP),把負類樣本預測為負類(TN),是模型預測正確的表現;當模型把正類樣本預測為負類(FN),把負類樣本預測為正類(FP),是模型預測錯誤的表現。
? ? ? ? 有了以上概念,我們來分析一下精確率和召回率。
精確率:
? ? ? ? 官方給出的公式為:?;
? ? ? ? 分析:該公式的意思是該模型將正類預測為正類的樣本數量與該模型將正類和負類均預測為正類的樣本數量的比值??雌饋碛悬c繞,我們分步分析:
????????分子TP是模型在預測時將正類預測為了正類的樣本數;分母是TP+FP,FP是模型在預測時,將負類預測為了正類的樣本數,即FP是假的正類樣本數,我們想一想,如果一個模型預測能力很強,那該模型會極大可能的把正類預測為正類,負類預測為負類,而極小可能的把負類預測為正類,也就是FP的樣本數應該越小越好,而FP越小,就會導致P的值越接近于1。是不是很神奇,人類太聰明了。
召回率:
? ? ? ? 官方給出的公式為:;
? ? ? ? 分析:該公式的意思是該模型將正類預測為正類的樣本數量與該模型將正類預測為正類和負類的樣本數量的比值。我們依然分步分析:
? ? ? ? 分子TP和精確率中的TP是一個含義;分母是TP+FN,FN是模型在預測時,將正類樣本預測為了負類樣本的樣本數,即FN指的是模型應該把正類樣本預測為為正類,但是卻把正類樣本預測為了負類樣本的數量;那我們想一想,如果一個模型的預測能力很強,那該模型應該極大可能的把正類預測為正類,而很小可能把正類預測為負類,也就是FN越小越好,FN越小,表示該模型有更大的把握把正類預測為正類,那么FN越小,就會導致R的值越接近于1。
? ? ? ? 總結,在分析完精確率和召回率的公式之后,我們知道了P和R的值當然是越接近于1,表明模型的預測能力越好。上面我說到的預測能力很強是用來表達模型的預測能力很優秀。
問題:那在評價模型的時候,我是應該以P為評價指標基準,還是以R為評價指標基準呢?
答:這里就引入了F1值,它是精確率P和召回率R的調和均值。
F1值:
? ? ? ? 公式為:,對該公式進行通分,將F1放到一邊,并將P、R帶入,求出公式為:
? ? ? ????????????????????????????????? ?
? ? ? ? 分析:對于該公式,分子TP是該模型將正類預測為正類的樣本數量,分母中的FP是該模型將負類預測為了正類,FN是該模型將正類預測為了負類;相應的,如果模型的預測能力很強,那么就應該很少可能的將負類預測為了正類,即FP應該越小越好,而根據精確率的公式,FP越小,P就越大;并且模型應該很少可能的將正類預測為了負類,即FN應該越小越好,而根據召回率的公式,FN越小,R就越大;而根據F1的公式來看,FP和FN越小,則F1越接近于1。
? ? ? ? 得出結論:精確率P和召回率R的值越大,F1的值也會越大,這里的越大指的是越接近于1,P、R、F1的值最大也就是1了。
????????總結不易,希望給個贊支持一下,轉載請注明鏈接哈,如果有總結不到位或表達不恰當之處,歡迎批評指正。
總結
以上是生活随笔為你收集整理的机器学习中的二分类问题评价指标之精确率、召回率、F1值通俗理解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 巧用Hosts文件 杀掉麻烦的IE浏览器
- 下一篇: 在移动网络上创建更稳定的连接