一篇文章告诉你标准化和归一化的区别?
進(jìn)一步推進(jìn)企業(yè)的標(biāo)準(zhǔn)化工作,使之發(fā)展水平適應(yīng)經(jīng)濟(jì)全球化下市場(chǎng)競(jìng)爭(zhēng)的要求,促進(jìn)企業(yè)綜合實(shí)力的提升是標(biāo)準(zhǔn)化建設(shè)的目標(biāo)。很多人認(rèn)為標(biāo)準(zhǔn)化理解為歸一化,然而是有區(qū)別的,下面告訴你不同之處:
(一)歸一化
特點(diǎn)
對(duì)不同特征維度的伸縮變換的目的是使各個(gè)特征維度對(duì)目標(biāo)函數(shù)的影響權(quán)重是一致的,即使得那些扁平分布的數(shù)據(jù)伸縮變換成類圓形。這也就改變了原始數(shù)據(jù)的一個(gè)分布。
好處
1 提高迭代求解的收斂速度
2 提高迭代求解的精度
(二)標(biāo)準(zhǔn)化
特點(diǎn)
對(duì)不同特征維度的伸縮變換的目的是使得不同度量之間的特征具有可比性。同時(shí)不改變?cè)紨?shù)據(jù)的分布。
好處
1 使得不同度量之間的特征具有可比性,對(duì)目標(biāo)函數(shù)的影響體現(xiàn)在幾何分布上,而不是數(shù)值上
2 不改變?cè)紨?shù)據(jù)的分布
舉例
根據(jù)人的身高和體重預(yù)測(cè)人的健康指數(shù)
假設(shè)有如下原始樣本數(shù)據(jù)是四維的(當(dāng)然一般不會(huì)有這么無(wú)聊的數(shù)據(jù))
從上面兩個(gè)坐標(biāo)圖可以看出,樣本在數(shù)據(jù)值上的分布差距是不一樣的,但是其幾何距離是一致的。而標(biāo)準(zhǔn)化就是一種對(duì)樣本數(shù)據(jù)在不同維度上進(jìn)行一個(gè)伸縮變化(而不改變數(shù)據(jù)的幾何距離),也就是不改變?cè)紨?shù)據(jù)的信息(分布)。這樣的好處就是在進(jìn)行特征提取時(shí),忽略掉不同特征之間的一個(gè)度量,而保留樣本在各個(gè)維度上的信息(分布)。
從采用大單位的身高和體重這兩個(gè)特征來(lái)看,如果采用標(biāo)準(zhǔn)化,不改變樣本在這兩個(gè)維度上的分布,則左圖還是會(huì)保持二維分布的一個(gè)扁平性;而采用歸一化則會(huì)在不同維度上對(duì)數(shù)據(jù)進(jìn)行不同的伸縮變化(歸一區(qū)間,會(huì)改變數(shù)據(jù)的原始距離,分布,信息),使得其呈類圓形。雖然這樣樣本會(huì)失去原始的信息,但這防止了歸一化前直接對(duì)原始數(shù)據(jù)進(jìn)行梯度下降類似的優(yōu)化算法時(shí)最終解被數(shù)值大的特征所主導(dǎo)。歸一化之后,各個(gè)特征對(duì)目標(biāo)函數(shù)的影響權(quán)重是一致的。這樣的好處是在提高迭代求解的精度。
了解標(biāo)準(zhǔn)化的真正含義,做好企業(yè)的標(biāo)準(zhǔn)化工作,是發(fā)展水平適應(yīng)經(jīng)濟(jì)全球化下市場(chǎng)競(jìng)爭(zhēng)的要求,也是促進(jìn)企業(yè)綜合實(shí)力的提升。搞好標(biāo)準(zhǔn)化,不僅能確保產(chǎn)品質(zhì)量,還有利于降低產(chǎn)品成本,促進(jìn)產(chǎn)品多樣化發(fā)展,加速產(chǎn)品更新?lián)Q代,提高企業(yè)的信譽(yù)。
總結(jié)
以上是生活随笔為你收集整理的一篇文章告诉你标准化和归一化的区别?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: logistic 损失函数的解释
- 下一篇: 回归算法 - 线性回归求解 θ(最大似然