sklearn分类模型
分類學(xué)習(xí)
輸入:一組有標(biāo)簽的訓(xùn)練數(shù)據(jù)(也稱觀察和評估),標(biāo)簽表明了這些數(shù) 據(jù)(觀察)的所署類別。
輸出:分類模型根據(jù)這些訓(xùn)練數(shù)據(jù),訓(xùn)練自己的模型參數(shù),學(xué)習(xí)出一個 適合這組數(shù)據(jù)的分類器,當(dāng)有新數(shù)據(jù)(非訓(xùn)練數(shù)據(jù))需要進行類別判斷,就 可以將這組新數(shù)據(jù)作為輸入送給學(xué)好的分類器進行判斷。
劃分?jǐn)?shù)據(jù)集
訓(xùn)練集(training set):顧名思義用來訓(xùn)練模型的已標(biāo)注數(shù)據(jù),用來建 立模型,發(fā)現(xiàn)規(guī)律。
測試集(testing set):也是已標(biāo)注數(shù)據(jù),通常做法是將標(biāo)注隱藏,輸送 給訓(xùn)練好的模型,通過結(jié)果與真實標(biāo)注進行對比,評估模型的學(xué)習(xí)能力。
訓(xùn)練集/測試集的劃分方法:根據(jù)已有標(biāo)注數(shù)據(jù),隨機選出一部分?jǐn)?shù)據(jù) (70%)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),余下的作為測試數(shù)據(jù),此外還有交叉驗證法, 自助法用來評估分類模型。
評價標(biāo)準(zhǔn)
精確率:精確率是針對我們預(yù)測結(jié)果而言的,(以二分類為例)它表示 的是預(yù)測為正的樣本中有多少是真正的正樣本。那么預(yù)測為正就有兩種可能 了,一種就是把正類預(yù)測為正類(TP),另一種就是把負(fù)類預(yù)測為正類(FP), 也就是
召回率:是針對我們原來的樣本而言的,它表示的是樣本中的正例有多 少被預(yù)測正確了。那也有兩種可能,一種是把原來的正類預(yù)測成正類(TP), 另一種就是把原來的正類預(yù)測為負(fù)類(FN),也就是
總結(jié)
以上是生活随笔為你收集整理的sklearn分类模型的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 谷歌李飞飞已经确认离职 接替者Andre
- 下一篇: 轮胎爆胎可以保险不