python 不确定度_python机器学习-chapter2_16
?分類器的不確定度
決策函數(shù)(decision_function):
二分類:返回類型為(n_samples, ),為每個樣本返回一個浮點數(shù),這個浮點數(shù)的正負號代表了預測的分類,值的大小代表了置信度。
多分類:返回類型為(n_samples, n_classes),每一列對應每個類別的“確定度分數(shù)”,分數(shù)越高的類別可能性越大
預測概率(predict_proba):
二分類:返回類型為(n_samples, 2),為每個樣本返回兩個數(shù),第一個數(shù)是估計為第一類的概率,第二個數(shù)為估計為第二類的概率。
多分類:返回類型為(n_samples, n_classes),每一列對應每個類別的預測概率,預測概率值越大的類別可能性越大。
?監(jiān)督學習總結
KNN:適用于小型數(shù)據集,是很好的基準模型,容易理解。
線性模型:適用于非常大的數(shù)據集,也是使用于高維數(shù)據,非常可靠的首選算法。
樸素貝葉斯:適用于非常大的數(shù)據集,也是使用于高維數(shù)據,只適用于分類問題,比線性模型速度快,但是比線性模型精度低。
決策樹:不需要數(shù)據縮放,速度快,可視化效果好,容易解釋。
隨機森林:不適合高維稀疏的數(shù)據集,比單顆決策樹的效果好,不需要數(shù)據縮放。
梯度提升決策樹:精度比隨機森林略高,預測速度快,訓練速度比隨機森林慢,需要調節(jié)更多的參數(shù)。
支持向量機:適用于特征相似的中等大小的數(shù)據集,在這種數(shù)據集上的效果很強大,需要數(shù)據縮放,需要調節(jié)更多參數(shù)。
神經網絡:可以構建及其復雜的模型,尤其對大型數(shù)據集,對數(shù)據縮放敏感,需要調節(jié)參數(shù)。
面對一個新的數(shù)據集,通常先從簡單的模型(線性模型、樸素貝葉斯、KNN)開始,觀察得到的結果,再考慮用更加復雜的模型(隨機森林、梯度提升機、SVM、神經網絡)。
總結
以上是生活随笔為你收集整理的python 不确定度_python机器学习-chapter2_16的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【codeBase_C++】C++ 读取
- 下一篇: python spark datafra