pandas(四) -- 数值计算
生活随笔
收集整理的這篇文章主要介紹了
pandas(四) -- 数值计算
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
1.1 均值
- 均值 df.mean() 整個(gè)DataFrame的均值,默認(rèn)NaN值不參與運(yùn)算
- 按行求均值axis=1
m2 = df.mean(axis=1)
- 按列求均值axis=0,或通過列名
1.2 分位數(shù)
pandas 分位數(shù)
1.3 一些其他函數(shù)
df.count(),→ count統(tǒng)計(jì)非Na值的數(shù)量 df.min(),→ min統(tǒng)計(jì)最小值 df['key2'].max()→ max統(tǒng)計(jì)最大值 df.sum()→ sum求和 df.mean()→ mean求平均值 df.median()→ median求算數(shù)中位數(shù),50%分位數(shù) df.std(),df.var()→ std,var分別求標(biāo)準(zhǔn)差,方差 df.skew()→ skew樣本的偏度 df.kurt()→ kurt樣本的峰度 df['key1_s'] = df['key1'].cumsum() # 計(jì)算累加和 df['key1_p'] = df['key1'].cumprod() #計(jì)算累積 df.cummax(),df.cummin() → cummax,cummin分別求累計(jì)最大值,累計(jì)最小值1.4 唯一值:.unique() 相當(dāng)于python中的set().
s = pd.Series(list('asdvasdcfgg')) ['a' 's' 'd' 'v' 'c' 'f' 'g'] <class 'numpy.ndarray'>1.5 值計(jì)數(shù):.value_counts() Series對(duì)象的性質(zhì),不能用于DataFrame
sc = s.value_counts(sort = False)# # 也可以這樣寫:pd.value_counts(sc, sort = False) d 2 a 2 s 2 c 1 f 1 g 2 v 1 dtype: int641.6 成員資格:.isin()逐個(gè)元素判斷,是否在xx中
df = pd.DataFrame({'key1':list('asdcbvasd'),'key2':np.arange(4,13)}) key1 key2 0 a 4 1 s 5 2 d 6 3 c 7 4 b 8 5 v 9 6 a 10 7 s 11 8 d 12 print(df.isin(['a','bc','10',8])) key1 key2 0 True False 1 False False 2 False False 3 False False 4 False True 5 False False 6 True False 7 False False 8 False False總結(jié)
以上是生活随笔為你收集整理的pandas(四) -- 数值计算的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python--pandas 分位数
- 下一篇: pandas(五) -- 文本处理