过拟合的原因以及解决办法
1、什么是過(guò)擬合?
欠擬合是指模型沒(méi)有能夠很好的表現(xiàn)數(shù)據(jù)的結(jié)構(gòu),而出現(xiàn)的擬合度不高的情況。?
過(guò)擬合是指模型過(guò)分的擬合訓(xùn)練樣本,但對(duì)測(cè)試樣本預(yù)測(cè)準(zhǔn)確率不高的情況,也就是說(shuō)模型泛化能力很差。如下圖所示:?
?
左邊的結(jié)果過(guò)度擬合訓(xùn)練樣本,導(dǎo)致過(guò)擬合。
2、過(guò)擬合的原因?
(1)數(shù)據(jù)特征的角度?
數(shù)據(jù)噪聲導(dǎo)致的過(guò)擬合:噪聲具有一定的隨機(jī)性與欺騙性,如果把噪聲作為有效信息的話,將會(huì)導(dǎo)致過(guò)擬合。?
缺乏代表性樣本導(dǎo)致的過(guò)擬合:訓(xùn)練數(shù)據(jù)集不能很好的反應(yīng)整體分布可能會(huì)導(dǎo)致過(guò)擬合;訓(xùn)練數(shù)據(jù)集較小,但模型過(guò)度細(xì)化會(huì)導(dǎo)致過(guò)擬合。?
(2)模型的角度?
由于模型過(guò)度復(fù)雜,使得模型對(duì)訓(xùn)練數(shù)據(jù)擬合較好,但同時(shí)擬合了噪聲或者與目標(biāo)不相關(guān)的信息導(dǎo)致了過(guò)擬合。?
3、過(guò)擬合、欠擬合的解決方法?
過(guò)擬合的可能解決方法:?
a、減少特征:刪除與目標(biāo)不相關(guān)特征,如一些特征選擇方法?
b、正則化:正則化會(huì)保證每個(gè)特征有一定的效用,不會(huì)使某一特征特別重要。
?c、得到更多的訓(xùn)練樣本
?d、遷移學(xué)習(xí)-----可以解決由于訓(xùn)練數(shù)據(jù)較小引起的過(guò)擬合。
?
欠擬合可能的解決方法:?
a、選擇更復(fù)雜的模型?
b、增加新特征,如特征構(gòu)建
?
?
?
總結(jié)
以上是生活随笔為你收集整理的过拟合的原因以及解决办法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Recurrence along Dep
- 下一篇: CAD不支持实时调试