日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

统计学基础_13描述性统计

發布時間:2024/3/7 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 统计学基础_13描述性统计 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1. 書籍和文中所提到的數據會在文末提供百度云下載,所有數據都不會有加密,可以放心下載使用

2. 文中計算的結果與書中不同是由于數據使用的時間段不同

目錄

1. 準備數據

2. 繪制頻數直方圖

?3. 數據的位置

4. 數據的離散度


1. 準備數據

原始數據 600000.csv 600050.csv 601398.csv 三個文件里是收盤價,通過收盤價計算日收益率

import pandas as pd # 中國工商銀行 ICBC 601398 # 浦發銀行 SPDB 600000 # 中國聯通 ChinaUnicom 600050 df_601398 = pd.read_csv('./601398.csv',encoding='utf-8') df_600000 = pd.read_csv('./600000.csv',encoding='utf-8') df_600050 = pd.read_csv('./600050.csv',encoding='utf-8') df_601398.head()

df_601398['o_date'] = df_601398['tradeDate'] df_601398['o_date'] = pd.to_datetime(df_601398['o_date']) df_601398.sort_values(by='o_date',ascending=True,inplace=True) # daily_returns 日收益率 df_601398['daily_returns'] = (df_601398['closePrice']-df_601398['closePrice'].shift(1))/df_601398['closePrice'].shift(1) df_601398.head()

df_600000['o_date'] = df_600000['tradeDate'] df_600000['o_date'] = pd.to_datetime(df_600000['o_date']) df_600000.sort_values(by='o_date',ascending=True,inplace=True) df_600000['daily_returns'] = (df_600000['closePrice']-df_600000['closePrice'].shift(1))/df_600000['closePrice'].shift(1)df_600050['o_date'] = df_600050['tradeDate'] df_600050['o_date'] = pd.to_datetime(df_600050['o_date']) df_600050.sort_values(by='o_date',ascending=True,inplace=True) df_600050['daily_returns'] = (df_600050['closePrice']-df_600050['closePrice'].shift(1))/df_600050['closePrice'].shift(1)# 中國工商銀行 gsyh df_601398.rename(columns={'daily_returns':'gsyh'},inplace=True) # 浦發銀行 pfyh df_600000.rename(columns={'daily_returns':'pfyh'},inplace=True) # 中國聯通 zglt df_600050.rename(columns={'daily_returns':'zglt'},inplace=True)df_601398 = df_601398.loc[:,['tradeDate','gsyh']] df_600000 = df_600000.loc[:,['tradeDate','pfyh']] df_600050 = df_600050.loc[:,['tradeDate','zglt']]

合并到一個表中,按日期對齊

three_df = pd.merge(df_601398,df_600000,how='inner',on='tradeDate') three_df = pd.merge(three_df,df_600050,how='inner',on='tradeDate') three_df.head()

three_df.to_csv('chapter_13_dailyreturns.csv',encoding='utf-8')

2. 繪制頻數直方圖

import matplotlib.pyplot as plt # 頻數直方圖 gsyh = three_df.gsyh plt.hist(gsyh)

?

?3. 數據的位置

概念:

樣本平均數(Sample Mean)、中位數(Median)、眾數(Mode)、百分位數(Percentile)

# 平均數 three_df.zglt.mean() # out: 0.0004284562650822751# 中位數 three_df.zglt.median() # out: 0.0# 眾數 three_df.zglt.mode() # out:0 0.0 # dtype: float64# 上下四分位數 [three_df.zglt.quantile(i) for i in [0.25,0.75]] # out: [-0.010317115551694248, 0.010245151847786325]

4. 數據的離散度

概念:

4.1 極差(Range)

4.2 平均絕對偏差(Mean Absolute Deviation)

4.3 方差(Variance) 和標準差(Standard Deviation)

方差公式:

?標準差公式:

# 極差 three_df.zglt.max()-three_df.zglt.min() # out: 0.2016438874062682# 平均絕對偏差 three_df.zglt.mad() # out: 0.015984757661984345# 方差 three_df.zglt.var() # out: 0.0005796109187107064# 標準差 three_df.zglt.std() # out: 0.024075109941819713

PS:

鏈接:https://pan.baidu.com/s/1Jck5WqDunfyph18UvguJ5g?
提取碼:5fo3

書籍

鏈接:https://pan.baidu.com/s/1xJD85-LuaA9z-Jy_LU5nOw?
提取碼:ihsg

總結

以上是生活随笔為你收集整理的统计学基础_13描述性统计的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。