日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

分类模型的评估方法-召回率(Recall)

發布時間:2025/3/20 编程问答 18 豆豆
生活随笔 收集整理的這篇文章主要介紹了 分类模型的评估方法-召回率(Recall) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

前2篇文章,介紹了正確率(Accuracy)精確率(Precision)的評估方法。其中指出了正確率(Accuracy)雖然簡單直觀,但在很多時候并不是一個真正正確的評估指標。

那么精確率(Precision)可能會有什么問題呢?我們還是看看它的計算公式:

Precision=+Precision=真陽真陽+假陽

如果“假陽=0”,那么精確率就是100%,這很好,但有什么問題呢?

舉個例子:癌癥檢查數據樣本有10000個,其中10個數據樣本是有癌癥,其它是無癌癥。分類模型在無癌癥數據中全都預測正確,在10個癌癥數據中預測正確了1個,此時真陽=1,真陰=9990,假陽=0,假陰=9。根據精確率的計算公式:

Precision=11+0=100%Precision=11+0=100%

顯然,這是不合理的。

因為”精確率“并沒有考慮到”假陰“的問題,即它只關心查出來的”癌癥”有多少是”真癌癥”,至于是癌癥但沒査出來的,認為不是“癌癥的”即”假陰“它管不著。但是,我們癌癥檢查的時候,有癌癥卻查出來”不是癌癥“,這是非常要命的。

所以考慮這種情況,那么就需要用到召回率(Recall),其計算公式為:

Recall=+Recall=真陽真陽+假陰

上面癌癥例子中,召回率的值為:

Recall=11+9=10%Recall=11+9=10%

即從召回率數值看,這個分類模型是不好的。

還是上面的例子:假設分類模型在無癌癥數據9990中預測正確了9980個,在10個癌癥數據中預測正確了10個。此時真陽=10,真陰=9980,假陽=10,假陰=0。則其精確度為10/(10+10)=50%,而召回率為10/(10+0)=100%。即精確度雖然不高,謊報了幾個癌癥,但是所有的真癌癥都沒有錯過,這是非常重要的。

所以,各種分類評估指標各有優缺點,我們具體采用什么指標來評估分類模型,關鍵還是看我們的具體應用。如果是地震、癌癥、欺詐交易等,我們寧愿有誤報,但不能錯過一個,這時就主要看召回率。如果是文檔搜索,我們并不關心搜的全不全,搜出來的都是我們想要的信息就夠了,那么就主要看精確率。

召回率(Recall)還有一個名稱,叫查全率。但是注意,查全率這個名稱主要用在信息檢索領域.例如一個論文數據庫,搜索”加器學習”相關論文,總共有100萬篇論文,其中與機器學習相關的論文有2萬篇,搜出來的文檔數量為1萬篇,其中真正與”機器學習”相關的文檔數量為9000篇,那么查全率就是9000/(9000+(20000-9000))=45%

總結

以上是生活随笔為你收集整理的分类模型的评估方法-召回率(Recall)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。