数据预处理之归一化(normalization)
生活随笔
收集整理的這篇文章主要介紹了
数据预处理之归一化(normalization)
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
概念介紹:
歸一化是利用特征的最大最小值,將特征的值縮放到[new_min,new_max]區(qū)間,對(duì)于每一列的特征使用min-max函數(shù)進(jìn)行縮放,計(jì)算公式如下
代碼示例:
import numpy as np from sklearn.preprocessing import MinMaxScaler,StandardScaler### Machine LearningAction Chapter2 rewrite def file2matrix(filename):data= np.genfromtxt(filename,delimiter="\t")returnMat=data[:,0:3]classLabelVector=data[:,3:4]return returnMat,classLabelVectordef autoNorm(dataset):x = dataset[:, 0:1]#method1 用skit-learn封裝的MinMaxScaler處理minMax = MinMaxScaler()x_std = minMax.fit_transform(x)print(x.min())print(x.max())print(x[2])print((26052-0)/91273)print(x_std[2])##method2 use lambdaa = lambda x: (x -x.min())/(x.max()-x.min())print(a(x)[2])if __name__ =='__main__':returnMat,classLabelVector=file2matrix('F:\\datingTestSet2.txt')autoNorm(returnMat)執(zhí)行結(jié)果:
數(shù)據(jù)集示意:
?
總結(jié)
以上是生活随笔為你收集整理的数据预处理之归一化(normalization)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 卫城八大碗存在了多少年?
- 下一篇: 厨房里的顽固油污怎样才能轻松去掉?