为什么要进行归一化处理?(从寻找最优解这个角度讨论)
例子
假定為預(yù)測(cè)房?jī)r(jià)的例子,自變量為面積,房間數(shù)兩個(gè),因變量為房?jī)r(jià)。
那么可以得到的公式為:
其中代表房間數(shù),代表變量前面的系數(shù)。
其中代表面積,代表變量前面的系數(shù)。
首先我們祭出兩張圖代表數(shù)據(jù)是否均一化的最優(yōu)解尋解過程。
未歸一化:
歸一化之后
為什么會(huì)出現(xiàn)上述兩個(gè)圖,并且它們分別代表什么意思。
我們?cè)趯ふ易顑?yōu)解的過程也就是在使得損失函數(shù)值最小的theta1,theta2。
上述兩幅圖代碼的是損失函數(shù)的等高線。
我們很容易看出,當(dāng)數(shù)據(jù)沒有歸一化的時(shí)候,面積數(shù)的范圍可以從0~1000,房間數(shù)的范圍一般為0~10,可以看出面積數(shù)的取值范圍遠(yuǎn)大于房間數(shù)。
影響
這樣造成的影響就是在畫損失函數(shù)的時(shí)候,
數(shù)據(jù)沒有歸一化的表達(dá)式,可以為:
造成圖像的等高線為類似橢圓形狀,最優(yōu)解的尋優(yōu)過程就是像下圖所示:
而數(shù)據(jù)歸一化之后,損失函數(shù)的表達(dá)式可以表示為:
其中變量的前面系數(shù)幾乎一樣,則圖像的等高線為類似圓形形狀,最優(yōu)解的尋優(yōu)過程像下圖所示:
從上可以看出,數(shù)據(jù)歸一化后,最優(yōu)解的尋優(yōu)過程明顯會(huì)變得平緩,更容易正確的收斂到最優(yōu)解。
轉(zhuǎn)載于:https://www.cnblogs.com/Bella2017/p/7753848.html
總結(jié)
以上是生活随笔為你收集整理的为什么要进行归一化处理?(从寻找最优解这个角度讨论)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 测试环境搭建 openwebmail+花
- 下一篇: jquery点击完一个按钮,并且触发另一