损失函数为什么用平方形式(二)
我們?cè)谝郧罢勥^《線性回歸損失函數(shù)為什么要用平方形式》,除了這篇文章中提到的理由外。還有什么依據(jù)呢?
平方形式的損失函數(shù)一般為:
這稱為 SSE(The sum of squares due to error), 誤差平方和。
還有一種稱為MSE(Mean Squared Error),均方差。
這兩種形式本質(zhì)上是等價(jià)的。只是MSE計(jì)算得到的值比SSE計(jì)算得到的值要小,因?yàn)槌艘粋€(gè)n。誤差平方和以及均方差的公式中有系數(shù)1/2,是為了求導(dǎo)后,系數(shù)被約去。
它們都是平方形式,一個(gè)重要原因是:誤差的平方形式是正的,是正數(shù)。這樣正的誤差和負(fù)的誤差不會(huì)相互抵消。這就是為什么不用一次方,三次方的原因。
但是,誤差的絕對(duì)值也是正的,為什么不用絕對(duì)值呢。所有還有第二個(gè)重要原因是:平方形式對(duì)大誤差的懲罰大于小誤差。例如:
(10?5)2=25,|10?5|=5
(10?8)2=4,|10?8|=2
一個(gè)是25:4,一個(gè)是5:2,顯然平方形式對(duì)大誤差的懲罰更大。
此外,還有第三個(gè)重要原因:平方形式對(duì)數(shù)學(xué)運(yùn)算也更友好。我們經(jīng)常要求損失函數(shù)的導(dǎo)數(shù),平方形式求導(dǎo)后變成一次函數(shù);而絕對(duì)值形式對(duì)求導(dǎo)數(shù)學(xué)運(yùn)算很不友好,需要分段求導(dǎo)。
此外,4次方,6次方,8次方雖然也能避免誤差正負(fù)相抵消,但對(duì)大誤差的懲罰又過大了;此外,求導(dǎo)后也仍然是多次函數(shù)。
總結(jié)
以上是生活随笔為你收集整理的损失函数为什么用平方形式(二)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 统计学---掌握数据的整体状态
- 下一篇: 统计学---数据的标准化