當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

机器学习中关于偏差、方差和误差的理解

發(fā)布時間：2024/1/1 编程问答 47 豆豆

生活随笔收集整理的這篇文章主要介紹了机器学习中关于偏差、方差和误差的理解小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

在模型預測中，模型可能出現(xiàn)的誤差來自兩個主要來源：

??1、因模型無法表示基本數(shù)據(jù)的復雜度而造成的偏差（bias);

??2、因模型對訓練它所用的有限數(shù)據(jù)過度敏感而造成的方差（variance)。

??誤差是測量值與真實值之間的差值。用誤差衡量測量結果的準確度，用偏差衡量測試結果的精確度；誤差是以真實值為標準，偏差是以多次測量結果的平均值為標準。

??而方差在統(tǒng)計學中是指各個數(shù)據(jù)與其平均數(shù)之差的平方的和的平均數(shù)，它表示的是一種偏離程度：當數(shù)據(jù)分布比較分散時，方差就較大；因此方差越大，數(shù)據(jù)的波動越大；方差越小，數(shù)據(jù)的波動就越小。

??從上面定義可以看出，偏差可以衡量我們所建立模型的精確度，精確度越高，我們用模型計算出的值與實際值越接近；而方差表示的是一種偏離程度，在一定程度上可以表示我們的模型對于任何給定的測試樣本會出現(xiàn)多大的變化。

??下面以一個圖片為例進一步說明。

??這張圖比較形象地展現(xiàn)了偏差和方差的區(qū)別：偏差越小，箭的位置總體離靶心較近，說明射手的水平較高；方差越小的話，箭射的位置大體在一小塊區(qū)域，說明射手發(fā)揮的很穩(wěn)定，但不一定代表他射的很好。

??如果模型具有足夠的數(shù)據(jù)，但因不夠復雜而無法捕捉基本關系，則會出現(xiàn)偏差。這樣一來，模型一直會系統(tǒng)地錯誤表示數(shù)據(jù)，從而導致準確率降低。這種現(xiàn)象叫做欠擬合(underfitting)。

??出現(xiàn)方差是正常的，但方差過高表明模型無法將其預測結果泛化到更多的數(shù)據(jù)。對訓練集高度敏感也稱為過擬合(overfitting)，而且通常出現(xiàn)在模型過于復雜或我們沒有足夠的數(shù)據(jù)支持它時。

以上是生活随笔為你收集整理的机器学习中关于偏差、方差和误差的理解的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。