當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Pandas学习笔记1（序列部分）

發布時間：2023/12/15 编程问答 31 豆豆

生活随笔收集整理的這篇文章主要介紹了 Pandas学习笔记1（序列部分）小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

人生苦短，我用Python

import pandas as pd import numpy as np """ 序列(Series):可以理解成R語言中的向量，Python中的列表、元組的高級版本。為什么說是高級,因為序列與上期介紹的一維數組類似，具有更好的廣播效應，既可以與一個標量進行運算，又可以進行元素級函數 """ ls_a=[1,3,5] seriesl=pd.Series(ls_a) seriesl+10 print(seriesl+10) """ return: 0 11 1 13 2 15 """#序列的索引--位置索引 np.random.seed(1) se=pd.Series(np.random.randint(size=5,low=1,high=10)) print(se) print(se[0]) #取第一個元素 print(se[1:3])#取第2、3個元素 print(se[::2])#依次取數，步數為2#序列索引--布爾索引 np.random.seed(23) se_bool=pd.Series(np.random.randint(size=5,low=1,high=100)) print(se_bool) """ 0 84 1 41 2 74 3 55 4 32 dtype: int32 """ print(se_bool[se_bool>=70])#取出大于等于70的值 """ 0 84 2 74 dtype: int32 """ print(se_bool[se_bool>=40][se_bool<=50]) #取出40~50之間的值 """ 1 41 dtype: int32 """""" 在R語言中一個向量的元素是否包含于另一個向量，可以使用%in%函數進行判斷， Python中也有類似的方法。對于一個一維數組，inld函數實現該功能; 對于一個序列，isin函數可以實現上述所說功能 """ array_num1=np.array([3,5,6,8]) array_num2=np.array([17,29,34,8]) print(np.in1d(array_num1,array_num2)) ''' return:[False False False True] array_num1包含array_num2的8，所以為True '''se_str1=pd.Series(["a","s","d","f"]) se_str2=pd.Series(["Z","s","M","d"]) print(np.isin(se_str1,se_str2)) """ return:[False True True False] """#序列去重及水平統計 np.random.seed(10) se_unique=np.random.randint(size=1000,low=1,high=4) #去重 print("去重:") print(pd.unique(se_unique)) """ return: 去重: [2 1 3] """#水平統計 print("水平統計") print(pd.value_counts(se_unique)) ''' 水平統計 3 342 2 334 1 324 '''np.random.seed(2) se_sort=pd.Series(np.random.normal(size=4)) #按序列的索引排序--降序排序 print("按序列的索引排序--降序排序") print(se_sort.sort_index(ascending=False)) """ 按序列的索引排序--降序排序 3 1.640271 2 -2.136196 1 -0.056267 0 -0.416758 dtype: float64 """ #按序列的值排序--升序排序 print("按序列的值排序--升序排序") print(se_sort.sort_values()) """ 按序列的值排序--升序排序 2 -2.136196 0 -0.416758 1 -0.056267 3 1.640271 dtype: float64 """""" 抽樣是數據分析中常用的方法，通過從總體中抽取出一定量的樣本來推斷總體水平；或者通過抽樣將數據拆分成兩部分，一部分建模，一部分測試。pandas模塊中的sample函數可以完成抽樣的任務 """ se_unique.sample(n=None,frac=None,replace=False,weights=None,random_state=None,axis=None) """ n:指定抽樣的樣本量； frac:指定抽取的樣本比例 replace:是否有放回抽樣，默認無放回 weights:指定樣本抽中的概率，默認等概論抽樣； random_state=指定抽樣的隨機種子 """ #從1~100中無放回（即抽取過的元素不會再抽取到）隨機抽取4個數字 s_sample=pd.Series(range(1,101)) print(s_sample.sample(n=4,random_state=3)) """ 93 94 67 68 6 7 64 65 dtype: int64 """#從1~6中有放回的抽取4個值 s_sample1=pd.Series(range(1,7)) print(s_sample1.sample(n=4,replace=True,random_state=2)) """ 0 1 5 6 0 1 3 4 dtype: int64 """#從男女性別中不等概率抽中10個樣本 s_sex=pd.Series(['男','女']) print(s_sex.sample(n=10,replace=True,weights=[0.2,0.8],random_state=3)) """ 1 女 1 女 1 女 1 女 1 女 1 女 0 男 1 女 0 男 1 女 dtype: object """#統計函數 np.random.seed(1234) s_describe=pd.Series(np.random.randint(size=100,low=1,high=30)) print(s_describe.describe()) """ count 100.000000--序列的元素個數 mean 15.730000--序列的平均值 std 7.844261--序列的標準差 min 1.000000--最小值 25% 10.000000 50% 16.000000 75% 22.000000 max 29.000000--最大值 dtype: float64 """復制代碼

總結

以上是生活随笔為你收集整理的Pandas学习笔记1（序列部分）的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：初学 Nginx （一） SSI 的作
下一篇： Design Patterns - Me