日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

数据分析与挖掘-python常用数据预处理函数

發布時間:2024/4/11 python 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数据分析与挖掘-python常用数据预处理函数 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

數據預處理往往在數據分析和數據挖掘領域占到了很大的比重,甚至在機器學習這些海量數據處理的場合,數據預處理也是最核心的工作。介紹幾個預處理階段常用的庫函數。

1.interpolate

插值函數,Scipy的子庫,包含大量的插值函數,如拉格朗日插值,樣條插值,高維插值等。

示例代碼:

from scipy.interpolate import * f = scipy.interpolate.lagrange(x,y) # 其中x和y分別為自變量和因變量數據

2.unique

numpy庫函數,也是Pandas中Series對象的一個方法。

示例代碼:

import numpy as np import pandas as pd data = [1, 2, 3] # data可以是list,ndarray,Series np.unique(data) data =pd.Series(data) data.unique()

3.random

numpy的子庫,生成特定分布的隨機矩陣。

示例代碼:

import numpy as np np.random.randn(k, m, n) # 生成k*m*n的隨機矩陣,元素服從正態分布

4.isnull/notnumm

Series對象的方法,返回布爾Series。

示例代碼:

import pandas as pd data = pd.Series() D.isnull() D[D.notnull()]

5.PCA

主成分分析函數,是Scikit-Learn下的建模對象。

示例代碼:

from sklearn.decomposition import PCA import numpy as np D = np.random.rand(10,4) pca = PCA() pca.fit(D) PCA(copy=True, n_components=Noone, whiten=False) # 輸出模型的特征向量 print(pca.components_) # 輸出各個成分各自的方差百分比 print(pca.explained_variance_ratio_)

具體代碼包括實戰項目可以查看我的github。

總結

以上是生活随笔為你收集整理的数据分析与挖掘-python常用数据预处理函数的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。