常见数据归一化的几种方法
生活随笔
收集整理的這篇文章主要介紹了
常见数据归一化的几种方法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
常見的數據歸一化方法
min-max標準化(Min-max normalization)/0-1標準化(0-1 normalization)
也叫離差標準化,是對原始數據的線性變換,使結果落到[0,1]區間,轉換函數如下:
其中max為樣本數據的最大值,min為樣本數據的最小值。
def Normalization(x):
??? return [(float(i)-min(x))/float(max(x)-min(x)) for i in x]
如果想要將數據映射到[-1,1],則將公式換成:
x?=x?xmean/xmax?xmin
x_mean表示數據的均值。
def Normalization2(x):
??? return [(float(i)-np.mean(x))/(max(x)-min(x)) for i in x]
這種方法有一個缺陷就是當有新數據加入時,可能導致max和min的變化,需要重新定義。
log函數轉換
通過以10為底的log函數轉換的方法同樣可以實現歸一下,具體方法如下:
看了下網上很多介紹都是x*=log10(x),其實是有問題的,這個結果并非一定落到[0,1]區間上,應該還要除以log10(max),max為樣本數據最大值,并且所有的數據都要大于等于1。
《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀總結
以上是生活随笔為你收集整理的常见数据归一化的几种方法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算标准差
- 下一篇: AutoBench+Httperf的安装