python 归一化_Python 数据归一化、标准化、正则化 (机器学习)
數據歸一化、標準化、正則化
1、歸一化
是將數據放縮到0~1區間,利用公式(x-min)/(max-min)
2、標準化
將數據轉化為標準的正態分布,均值為0,方差為1
3、正則化
正則化的主要作用是防止過擬合,對模型添加正則化項可以限制模型的復雜度,使得模型在復雜度和性能達到平衡。
常用的正則化方法有L1正則化和L2正則化。L1正則化和L2正則化可以看作是損失函數的懲罰項。所謂“懲罰”就是對損失函數中的某些參數做一些限制。
4、代碼測試
4.1 導庫
import pandas as pd
import numpy as np
from sklearn.preprocessing import MinMaxScaler
from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import Normalizer1
2
3
4
5
6
4.2 創建數據
x=np.random.randint(1,1000,(10000,5))
x=pd.DataFrame(x)1
2
4.3 查看原始數據的均值、方差
display(x.mean())
display(x.var())1
2
4.4 歸一化
from sklearn.preprocessing import MinMaxScaler
x_min=MinMaxScaler().fit_transform(x)
x_min=pd.DataFrame(x_min)
display(x_min.mean())
display(x_min.var())1
2
3
4
5
4.5 標準化
from sklearn.preprocessing import StandardScaler
x_std=StandardScaler().fit_transform(x)
x_std=pd.DataFrame(x_std)
display(x_std.mean())
display(x_std.var())1
2
3
4
5
4.6 正則化
from sklearn.preprocessing import Normalizer
x_nor=Normalizer().fit_transform(x)
x_nor=pd.DataFrame(x_nor)1
2
3
文章來源: blog.csdn.net,作者:魏寶航,版權歸原作者所有,如需轉載,請聯系作者。
原文鏈接:blog.csdn.net/m0_47256162/article/details/113791082
總結
以上是生活随笔為你收集整理的python 归一化_Python 数据归一化、标准化、正则化 (机器学习)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 教你一招Linux下文本比对方法
- 下一篇: Python迭代器实现