数据标准化 - scale() - Python代码
標準化
去均值,方差規模化
數據分析的過程中,比如線性規劃這一類的分析,如果有些特征的數值遠遠高于或低于其他數值,通常稱之為獨立點、異常值或噪點,那么對于受噪點影響較大的模型就無法正確地去學習其他特征。
Standardization標準化:將特征數據的分布調整成標準正太分布,也叫高斯分布,過程為兩步:去均值的中心化(均值變為0);方差的規模化(方差變為1)。
在sklearn.preprocessing中有一個scale方法,可以實現數據標準化,該方法默認按照列進行標準化。
運行結果:
標準化之前的方差: [ 1. 0.5 -0.5 0.5]
標準化之前的標準差: [0.70710678 1.11803399 1.80277564 1.80277564]
標準化結果:
[[ 0. -1.34164079 1.38675049 1.38675049]
[ 1.41421356 -0.4472136 0.2773501 -1.38675049]
[-1.41421356 0.4472136 -0.2773501 -0.2773501 ]
[ 0. 1.34164079 -1.38675049 0.2773501 ]]
標準化之后的方差: [0. 0. 0. 0.]
標準化之后的標準差: [1. 1. 1. 1.]
數據歸一化 MinMaxScaler()/MaxAbsScaler() 文章鏈接
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的数据标准化 - scale() - Python代码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 字符串处理 - DataFrame文本数
- 下一篇: sqlserver2008驱动_Pyth