Python数据聚合的方法
生活随笔
收集整理的這篇文章主要介紹了
Python数据聚合的方法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
本文主要講解Python中的數據聚合的函數,函數主要由兩個:size(),count();
size 跟 count 的區別:
1、count()方法用于統計字符串里某個字符出現的次數。可選參數為在字符串搜索的開始與結束位置,size()函數主要是用來統計矩陣元素個數,或矩陣某一維上的元素個數的函數。
2、size 計數時包含 NaN 值,而 count 不包含 NaN 值 ;
#Python數據聚合的方法 import numpy as np import pandas as pd #數據聚合的方法有兩個;size(),count(); #定義矩陣 df = pd.DataFrame({"Name":["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"],"City":["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"],"Val":[4,3,3,np.nan,np.nan,4]})s=df.groupby(["Name", "City"],as_index=False)['Val'].count() print(s)s1 = df.groupby(["Name", "City"])['Val'].size().reset_index(name='s') print(s1)結果:
根據以上結果我們可以看到,count()函數,對于val列為空的行沒有展示。
其中:groupby函數主要的作用是進行數據的分組以及分組后地組內運算,在前文中已有描述!,用法如下:
df[](指輸出數據的結果屬性名稱).groupby([df[屬性],df[屬性])(指分類的屬性,數據的限定定語,可以有多個).mean()(對于數據的計算方式——函數名稱)
總結
以上是生活随笔為你收集整理的Python数据聚合的方法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 线性与非线性规划:三次拟合
- 下一篇: websocket python爬虫_p