用python完成《商务与经济统计(第13版)》课后练习——第7章和第8章
這次作業練習收獲挺多,難的不是練習題,而是在計算前的數據預處理。本來以為可以很快解決的,還是花了些力氣,看來還是要多練習~
文章目錄
- chapter7-14題
- chapter8-6題
- chapter8-22題
chapter7-14題
晨星公布了1208家企業的股票信息數據(晨星官網,2012年10月24日)。這些股票中的40只組成一個樣本,存放在數據文件Morningstar.csv 中,利用Morningstar數據集回答下列問題。
1.求晨星股票中達到最高評級5星的股票所占比率的點估計。
2.求晨星股票中商業風險評級高于平均水平的股票所占比率的點估計。
3.求晨星股票中評級不高于2星的股票所占比率的點估計。
數據預處理
import pandas as pd import numpy as np##讀取數據 ms = pd.read_csv("/myfile/個人事務/數據分析學習/商務與經濟統計/數據文件/第7章/Morningstar.csv",sep=",") ms.head(10)
星級和風險水平都是字符串的形式,為了方便計算先轉換成數值型
1.求5星所占比率的點估計
2.求高于平均水平的股票所占比率的點估計
3.求評級不高于2星的股票所占比率的點估計
chapter8-6題
全球商務旅行協會(GBTA)對旅行中住宿、租車、和餐飲方面每天的旅行稅進行了研究,試圖評價各個城市的每日總旅行稅。關于芝加哥商務旅行的研究結果存放在名為TravelTax的文件中(GBTA基金,2012年10月30日)。假設已知總體標準差為8.05美元,試求芝加哥每日旅行稅的總體均值的區間估計,取95%置信區間。
TT = pd.read_csv("/myfile/個人事務/數據分析學習/商務與經濟統計/數據文件/第8章/TravelTax.csv",sep=",") TT.head(10) # 95%置信區間,z_score = 1.96,直接計算 tax = TT["Lodging, Car Rental, and Meal Taxes ($)"] tax_mean = tax.mean() n = len(tax) tax_sigma = 8.50 tax_up = tax_mean + 1.96*tax_sigma/np.sqrt(n) tax_low = tax_mean - 1.96*tax_sigma/np.sqrt(n) print(tax_up) print(tax_low) # 編寫函數求解 from scipy.stats import norm import numpy as np def confidence_interval(sample_mean,population_std,sample_size,confidence):alpha = 1 - confidence z = abs(norm.ppf(alpha/2)) #求z_score的值# 根據概率求解z值,或者是求解陰影面積,它的逆操作是norm.cdf(z_score)upper_limit = sample_mean + z*population_std/np.sqrt(sample_size)lower_limit = sample_mean - z*population_std/np.sqrt(sample_size)return [lower_limit,upper_limit]chapter8-22題
漫威公司電影《銀河護衛隊》在2014年勞動節周末的前兩天上映,其票房收入打破北美記錄,達到9340萬美元(《好萊塢報道》,2014年8月3日)。由30家電影院組成一個樣本,其票房銷售收入(單位:美元)存放在名為Guardians的文件中。
1.求每家電影院票房銷售收入均值的95%置信區間,并解釋這個結果。
2.電影票的價格是每張8.11美元,試估計每家電影院的平均觀影人數。
3.該部影片已經在4080家影院上映,估計觀看電影《銀河護衛隊》的觀眾總人數和周末的票房收入。
數據預處理
# 讀取文件 movie = pd.read_csv("/myfile/個人事務/數據分析學習/商務與經濟統計/數據文件/第8章/Guardians.csv",sep=",") movie.head()
在西文表達中,數值被加入逗號分隔開,因此先要去除數字中的逗號并轉換為數值型,才能進行計算。
1.求95%置信區間
# 總體標準差未知,使用t分布求解 from scipy.stats import t # import numpy as np def confidence_interval_t(sample_mean,sample_std,sample_size,confidence):alpha = 1 - confidencet_df = sample_size - 1 #自由度t_score = abs(t.ppf(alpha/2,t_df))# 根據概率求解t值,或者是求解陰影面積,它的逆操作是t.cdf(t_score) upper_limit = sample_mean + t_score * sample_std/np.sqrt(sample_size)lower_limit = sample_mean - t_score * sample_std/np.sqrt(sample_size)return [lower_limit,upper_limit]movie_mean = np.mean(m_num) movie_std = np.std(m_num,ddof = 1) #計算中使用的除數是N-ddof n_movie = len(m_num) m_limit = confidence_interval_t(movie_mean,movie_std,n_movie,0.95) m_limit2.每家影院的平均觀影人數
price = 8.11 mean_people = sum(m_num)/price/n_movie mean_people3.求觀影總人數和票房
cinema = 4080 sum_people = mean_people * cinema income_movie = sum_people * price print("觀看電影的觀眾總人數為{},周末的總票房為{}。".format(sum_people,income_movie))總結
以上是生活随笔為你收集整理的用python完成《商务与经济统计(第13版)》课后练习——第7章和第8章的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Humble Numbers USCAO
- 下一篇: 国内优秀的PHP后台管理系统(CMS)整