过拟合的原因和解决方案
一、過擬合的原因
1. 訓練集的數量級和模型的復雜度不匹配。訓練集的數量級要小于模型的復雜度;
2. 訓練集和測試集特征分布不一致;
3. 樣本里的噪音數據干擾過大,大到模型過分記住了噪音特征,反而忽略了真實的輸入輸出間的關系;
4. 權值學習迭代次數足夠多(Overtraining),擬合了訓練數據中的噪聲和訓練樣例中沒有代表性的特征。
二、過擬合的解決方案
1. 調小模型復雜度,使其適合自己訓練集的數量級(縮小寬度和減小深度);
2. 訓練集越多,過擬合的概率越小。在計算機視覺領域中,增廣的方式是對圖像旋轉,縮放,剪切,添加噪聲等;
3. 參數太多,會導致我們的模型復雜度上升,容易過擬合,也就是我們的訓練誤差會很小。正則化是指通過引入額外新信息來解決機器學習中過擬合問題的一種方法。這種額外信息通常的形式是模型復雜性帶來的懲罰度。 正則化可以保持模型簡單,另外,規則項的使用還可以約束我們的模型的特性;L0范數是指向量中非0的元素的個數,L1范數是指向量中各個元素絕對值之和,L2范數是指向量各元素的平方和然后求平方根。
4. dropout方法是ImageNet中提出的一種方法,通俗一點講就是dropout方法在訓練的時候讓神經元以一定的概率不工作。
轉自:https://www.toutiao.com/a6570854068908982787/?tt_from=mobile_qq&utm_campaign=client_share×tamp=1529926303&app=news_article&utm_source=mobile_qq&iid=29811624951&utm_medium=toutiao_android
總結
以上是生活随笔為你收集整理的过拟合的原因和解决方案的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 客户端Connection reset
- 下一篇: VMTools安装