机器学习评估指标 - f1, precision, recall, acc, MCC
1 介紹 TP, TF, FP, FN
??????? TP, TF, FP, FN 是針對二分類任務預測結果得到的值,這四個值構成了混淆矩陣;
??????? 如下圖的混淆矩陣:
??????? 左側表示真實的標簽,human標記為0; fake標記為1;
??????? 右側部分predicted class表示預測的標簽;
??????? 因此: TN表示(True -- 預測正確, Negitive, 預測為0)預測標簽為0(human),預測正確;
???????????????????? FN表示(False -- 預測錯誤,Negitive, 預測為0)預測標簽為0(human),預測錯誤;
???????????????????? FP表示? (False -- 預測錯誤, Positive, 預測為1)預測標簽為1(fake),預測錯誤;
???????????????????? TP表示(True -- 預測正確, Positive, 預測為1)預測標簽為1(fake),預測正確;
2 介紹f1, precision, recall, acc, MCC
????????f1, precision, recall, acc, MCC是由上述混淆矩陣的四個值計算得到的;
??????? 計算公式:
??????? ?
? ? ? ? ? ? ? ? acc預測的真實結果,總體數據中,有多少數據被預測正確了;
????????
? ? ? ? ? ? ? ? recall 預測為bot且預測正確的數量占全部預測為bot數量的比例;
????????
? ? ? ? ? ? ? ? Precision 預測為bot且預測正確的數量占實際為bot數量的比例;
????????
??????? MCC =
? ? ? ? f1 和 Mcc為綜合評價指標;
上述五個指標優劣分析:
????????準確度(acc)衡量有多少樣本在兩個類中被正確識別,但它不表示一個類能否被另一個類更好地識別;
????????高精確度(Precision)表明許多被識別為1(bot)的樣本被正確識別,但它沒有提供有關尚未識別的1(bot)樣本的任何信息;
????????該信息由召回指標(recall)提供,表示在整個1(bot)樣本集中有多少樣本被正確識別:低召回意味著許多1(bot)樣本未被識別;
??????? F1 和 MCC 試圖在以一個單一的值中傳達預測的質量,并結合其他指標。
????????MCC 被認為是 F1 的無偏版本,因為它使用了混淆矩陣的所有四個元素。 MCC 值接近 1 表示預測非常準確;接近 0 的值意味著預測并不比隨機猜測好,接近 -1 的值意味著預測與真實類別嚴重不一致。
????????
總結
以上是生活随笔為你收集整理的机器学习评估指标 - f1, precision, recall, acc, MCC的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 读书笔记:微信小程序布局之行内元素和块级
- 下一篇: 苹果三代耳机_苹果准备三款AirPods