當前位置：首頁 > 编程语言 > python >内容正文

python

python 不确定度_python机器学习-chapter2_16

發(fā)布時間：2023/12/10 python 44 豆豆

生活随笔收集整理的這篇文章主要介紹了 python 不确定度_python机器学习-chapter2_16 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

?分類器的不確定度

決策函數(shù)(decision_function)：

二分類：返回類型為(n_samples, )，為每個樣本返回一個浮點數(shù)，這個浮點數(shù)的正負號代表了預測的分類，值的大小代表了置信度。

多分類：返回類型為(n_samples, n_classes)，每一列對應每個類別的“確定度分數(shù)”，分數(shù)越高的類別可能性越大

預測概率(predict_proba)：

二分類：返回類型為(n_samples, 2)，為每個樣本返回兩個數(shù)，第一個數(shù)是估計為第一類的概率，第二個數(shù)為估計為第二類的概率。

多分類：返回類型為(n_samples, n_classes)，每一列對應每個類別的預測概率，預測概率值越大的類別可能性越大。

?監(jiān)督學習總結

KNN：適用于小型數(shù)據集，是很好的基準模型，容易理解。

線性模型：適用于非常大的數(shù)據集，也是使用于高維數(shù)據，非常可靠的首選算法。

樸素貝葉斯：適用于非常大的數(shù)據集，也是使用于高維數(shù)據，只適用于分類問題，比線性模型速度快，但是比線性模型精度低。

決策樹：不需要數(shù)據縮放，速度快，可視化效果好，容易解釋。

隨機森林：不適合高維稀疏的數(shù)據集，比單顆決策樹的效果好，不需要數(shù)據縮放。

梯度提升決策樹：精度比隨機森林略高，預測速度快，訓練速度比隨機森林慢，需要調節(jié)更多的參數(shù)。

支持向量機：適用于特征相似的中等大小的數(shù)據集，在這種數(shù)據集上的效果很強大，需要數(shù)據縮放，需要調節(jié)更多參數(shù)。

神經網絡：可以構建及其復雜的模型，尤其對大型數(shù)據集，對數(shù)據縮放敏感，需要調節(jié)參數(shù)。

面對一個新的數(shù)據集，通常先從簡單的模型(線性模型、樸素貝葉斯、KNN)開始，觀察得到的結果，再考慮用更加復雜的模型(隨機森林、梯度提升機、SVM、神經網絡)。

以上是生活随笔為你收集整理的python 不确定度_python机器学习-chapter2_16的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。