當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

一文带你了解混淆矩阵！

發(fā)布時間：2024/8/23 编程问答 38 豆豆

生活随笔收集整理的這篇文章主要介紹了一文带你了解混淆矩阵！小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

來源 |?數(shù)據(jù)科學(xué)CLUB

封圖 | CSDN 下載自視覺中國

混淆矩陣是一個表，經(jīng)常用來描述分類模型(或“分類器”)在已知真實值的一組測試數(shù)據(jù)上的性能?；煜仃嚤旧肀容^容易理解，但是相關(guān)術(shù)語可能會令人混淆。

讓我們從一個二進制分類器的混淆矩陣示例開始(盡管它可以很容易地擴展到兩個以上的類):

我們能從這個矩陣中了解到什么?

現(xiàn)在讓我們定義最基本的術(shù)語:

我已經(jīng)將這些項添加到混淆矩陣中，并且添加了行和列總數(shù):

這是一個比率的列表，通常是從一個混淆矩陣的二元分類器里得出:

還有幾個術(shù)語也值得一提:

零錯誤率（Null Error Rate）: 這是如果你總是預(yù)測大多數(shù)類，你就會錯的頻率。(在我們的例子中，零錯誤率將是60/165=0.36，因為如果你總是預(yù)測yes，那么您只會在60個“no”的情況下出錯。)這可以作為比較分類器的基準(zhǔn)度量。然而，對于一個特定的應(yīng)用程序，最好的分類器有時會有比零錯誤率更高的錯誤率，正如 “Accuracy Paradox（精確度悖論）”所證明的那樣。
Cohen's Kappa: 這本質(zhì)上是對分類器的性能的一種度量，與它僅僅是偶然的性能進行比較。換句話說，如果模型的準(zhǔn)確率和零錯誤率之間有很大的差異，那么模型的Kappa分?jǐn)?shù)就會很高。
F Score:這是真實陽性率(召回率)和正確率的加權(quán)平均值。
ROC曲線:這是一個常用的圖表，它總結(jié)了分類器在所有可能閾值上的性能。當(dāng)你改變將觀察值分配給給定類的閾值時，通過繪制真陽性率（y軸）與假陽性率（x軸）來生成它。

以上是生活随笔為你收集整理的一文带你了解混淆矩阵！的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。