日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

分类模型的评估方法-召回率(Recall)

發布時間:2025/3/20 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 分类模型的评估方法-召回率(Recall) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

前2篇文章,介紹了正確率(Accuracy)精確率(Precision)的評估方法。其中指出了正確率(Accuracy)雖然簡單直觀,但在很多時候并不是一個真正正確的評估指標。

那么精確率(Precision)可能會有什么問題呢?我們還是看看它的計算公式:

Precision=+Precision=真陽真陽+假陽

如果“假陽=0”,那么精確率就是100%,這很好,但有什么問題呢?

舉個例子:癌癥檢查數據樣本有10000個,其中10個數據樣本是有癌癥,其它是無癌癥。分類模型在無癌癥數據中全都預測正確,在10個癌癥數據中預測正確了1個,此時真陽=1,真陰=9990,假陽=0,假陰=9。根據精確率的計算公式:

Precision=11+0=100%Precision=11+0=100%

顯然,這是不合理的。

因為”精確率“并沒有考慮到”假陰“的問題,即它只關心查出來的”癌癥”有多少是”真癌癥”,至于是癌癥但沒査出來的,認為不是“癌癥的”即”假陰“它管不著。但是,我們癌癥檢查的時候,有癌癥卻查出來”不是癌癥“,這是非常要命的。

所以考慮這種情況,那么就需要用到召回率(Recall),其計算公式為:

Recall=+Recall=真陽真陽+假陰

上面癌癥例子中,召回率的值為:

Recall=11+9=10%Recall=11+9=10%

即從召回率數值看,這個分類模型是不好的。

還是上面的例子:假設分類模型在無癌癥數據9990中預測正確了9980個,在10個癌癥數據中預測正確了10個。此時真陽=10,真陰=9980,假陽=10,假陰=0。則其精確度為10/(10+10)=50%,而召回率為10/(10+0)=100%。即精確度雖然不高,謊報了幾個癌癥,但是所有的真癌癥都沒有錯過,這是非常重要的。

所以,各種分類評估指標各有優缺點,我們具體采用什么指標來評估分類模型,關鍵還是看我們的具體應用。如果是地震、癌癥、欺詐交易等,我們寧愿有誤報,但不能錯過一個,這時就主要看召回率。如果是文檔搜索,我們并不關心搜的全不全,搜出來的都是我們想要的信息就夠了,那么就主要看精確率。

召回率(Recall)還有一個名稱,叫查全率。但是注意,查全率這個名稱主要用在信息檢索領域.例如一個論文數據庫,搜索”加器學習”相關論文,總共有100萬篇論文,其中與機器學習相關的論文有2萬篇,搜出來的文檔數量為1萬篇,其中真正與”機器學習”相關的文檔數量為9000篇,那么查全率就是9000/(9000+(20000-9000))=45%

總結

以上是生活随笔為你收集整理的分类模型的评估方法-召回率(Recall)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。