日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

统计学基础整理

發(fā)布時(shí)間:2023/12/20 编程问答 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 统计学基础整理 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

本文只是個(gè)人對(duì)統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)的一點(diǎn)整理,僅作參考。

基礎(chǔ)知識(shí)

數(shù)據(jù)壓縮的方法,制作“圖”和“統(tǒng)計(jì)量”,用來反映數(shù)據(jù)特性。
平均值的計(jì)算:
1. 所有數(shù)據(jù)相加除以個(gè)數(shù)
2. 組值乘以相對(duì)頻數(shù)的合計(jì)

直方圖中平均值的意義:將直方圖看做挑擔(dān)人偶玩具(類似杠桿)時(shí)平衡的支點(diǎn)

平均值的性質(zhì):
1. 數(shù)據(jù)在平均值的周邊分布
2. 多次出現(xiàn)的數(shù)據(jù)對(duì)平均值的影響比較大
3. 直方圖呈左右對(duì)稱的情況下,其對(duì)稱軸通過的點(diǎn)是平均值

平均值計(jì)算類型:(基本規(guī)律是:先聚合,再分解,先進(jìn)行的操作最后逆操作)
1. 算術(shù)平均值:x+y2
2. 幾何平均值:xy??
3. 均方根值:x2+y22?????
4. 調(diào)和平均數(shù):21x+1y

偏差的計(jì)算:偏差 = 數(shù)據(jù) - 平均值
方差的計(jì)算:方差 = 偏差的平方的和/數(shù)據(jù)個(gè)數(shù),方差 = (組值 - 平均數(shù))的平方 * 相對(duì)頻數(shù)的總和
標(biāo)準(zhǔn)差的計(jì)算:標(biāo)準(zhǔn)差 = 方差開根號(hào) = 偏差的均方根值

標(biāo)準(zhǔn)差的意義:數(shù)據(jù)以平均值為基點(diǎn),在其左右擴(kuò)散,評(píng)價(jià)這種擴(kuò)散、分散程度的是標(biāo)準(zhǔn)差,是數(shù)據(jù)離散程度的平均化。
數(shù)據(jù)約有幾個(gè)標(biāo)準(zhǔn)差:(數(shù)據(jù) - 平均值)/ 標(biāo)準(zhǔn)差,反映數(shù)據(jù)是否特殊
數(shù)據(jù)的標(biāo)準(zhǔn)化,設(shè)數(shù)據(jù)為x,平均值是μ,標(biāo)準(zhǔn)差是σ,則數(shù)據(jù)標(biāo)準(zhǔn)化(z-score):

z=x?μσ
這樣數(shù)據(jù)就符合 μ=0,σ=1的標(biāo)準(zhǔn)正態(tài)分布

金融商品優(yōu)劣性評(píng)價(jià)基準(zhǔn):夏普比率(SPM)= (X的回報(bào) - 國債的收益率)/ (X的風(fēng)險(xiǎn)),設(shè)E(Rp)是投資組合預(yù)期報(bào)酬率(回報(bào)),Rf是無風(fēng)險(xiǎn)利率(國債收益率),σp是投資組合的標(biāo)準(zhǔn)差(風(fēng)險(xiǎn)),則:

SharpRatio=E(Rp)?Rfσp
夏普比例越大,金融商品越優(yōu)良

推論方法:
* 演繹法:由全體推論部分
* 歸納法:由部分推論全體

正態(tài)分布

正態(tài)分布是自然界和人類社會(huì)中最常見的分布,如拋硬幣、身高數(shù)據(jù)等
標(biāo)準(zhǔn)正態(tài)分布,平均值μ=0,標(biāo)準(zhǔn)差σ=1
關(guān)于標(biāo)準(zhǔn)正太分布的一些性質(zhì):
* 標(biāo)準(zhǔn)差在(+1)~(-1) 范圍內(nèi)的數(shù)據(jù)的相對(duì)頻數(shù)為0.6826(70%弱)
* 標(biāo)準(zhǔn)差在(+2)~(-2) 范圍內(nèi)的數(shù)據(jù)的相對(duì)頻數(shù)為0.9544(95%強(qiáng))

一般正態(tài)分布的數(shù)據(jù),由σ×x+μ可得

關(guān)于一般正太分布的一些性質(zhì):
* 在(μ+σ×1)~(μ?σ×1) 范圍內(nèi)的數(shù)據(jù)的相對(duì)頻數(shù)為0.6826(70%弱)
* 在(μ+σ×2)~(μ?σ×2) 范圍內(nèi)的數(shù)據(jù)的相對(duì)頻數(shù)為0.9544(95%強(qiáng))

標(biāo)準(zhǔn)正態(tài)分布的95%預(yù)測(cè)命中區(qū)間是-1.96+以上+1.96以下
平均值是μ、標(biāo)準(zhǔn)差是σ的正態(tài)分布95%的預(yù)測(cè)命中區(qū)間是(μ?1.96σ)以上(μ+1.96σ)以下
數(shù)據(jù)X是平均值是μ、標(biāo)準(zhǔn)差是σ的正態(tài)分布時(shí),95%預(yù)測(cè)命中區(qū)間為解不等式:

?1.96x?μσ+1.96

95%的置信區(qū)間:由各種各樣觀測(cè)值用相同方法進(jìn)行區(qū)間估計(jì),其中95%包含正確的總體參數(shù)

估計(jì)、推論

隨機(jī)抽樣法的假設(shè),是“進(jìn)行足夠多次數(shù)的觀測(cè)做成直方圖,再現(xiàn)母群體分布”的假設(shè)
表示母群體的平均值叫總體均值,表示母群體數(shù)據(jù)分散程度的統(tǒng)計(jì)量是總體標(biāo)準(zhǔn)差
總體標(biāo)準(zhǔn)差 = (數(shù)據(jù)的數(shù)值) - (總體均值μ
總體標(biāo)準(zhǔn)差σ=偏差的均方根
總體方差σ2=總體標(biāo)準(zhǔn)差的平方

觀測(cè)到的數(shù)據(jù),在一定程度上可以認(rèn)為接近總體均值
觀測(cè)復(fù)數(shù)的數(shù)據(jù),它的平均值叫做樣本均值,可以記作xˉ
觀測(cè)復(fù)數(shù)的數(shù)據(jù)取樣本均值,比1個(gè)數(shù)據(jù)更接近總體均值。觀測(cè)數(shù)據(jù)越多,樣本均值越接近總體均值的可能性就越高

大數(shù)定律(伯努利):從1個(gè)母群體中,觀測(cè)n個(gè)數(shù)據(jù)取其樣本均值,此時(shí),n越大,樣本均值為接近總體均值μ的數(shù)值的可能性越高。

中心極限定理:是概率論中討論隨機(jī)變量序列部分和分布漸近于正態(tài)分布的一類定理
* 設(shè)從均值為μ,方差為σ2(有限)的任意一個(gè)獨(dú)立同分布的總體中抽取的樣本量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ,方差為σ2n,標(biāo)準(zhǔn)差為σn的正態(tài)分布。

正太母群體的樣本均值的95%的預(yù)測(cè)命中區(qū)間為:(μ?1.96σn)以上(μ+1.96σn)以下,表示為不等式為:

?1.96xˉ?μσn+1.96
的解的范圍

μ的95%的置信區(qū)間為

xˉ?1.96σnμ+xˉ+1.96σn

卡方分布

對(duì)于標(biāo)準(zhǔn)正太母群體中n個(gè)樣本x1,x2,x3,...xn,將它們平方再合計(jì)得到:
V=x21+x22+x23+...+x2n
得統(tǒng)計(jì)量V,則V呈自由度為n的卡方分布

卡方分布的V,只出現(xiàn)0以上的值。另外,距0近的數(shù)值的相對(duì)頻數(shù)大,距0遠(yuǎn)的數(shù)值的相對(duì)頻數(shù)小

總體均值對(duì)未知的正太母群體總體方差進(jìn)行區(qū)間估計(jì)的方法:
1. 首先計(jì)算樣本均值xˉ,并計(jì)算樣本方差s2
2. 利用樣本方差s2乘以n再除以總體方差σ2作統(tǒng)計(jì)量

W=(x1?xˉ)2σ2+(x2?xˉ)2σ2+...+(xn?xˉ)2σ2
3. 確認(rèn)自由度(n-1)的95%的預(yù)測(cè)命中區(qū)間
4. 保留能使 W進(jìn)入第3步區(qū)間的σ2,舍掉不能的,求出總體方差 σ2的95%置信區(qū)間

t分布

由總體均值μ和樣本得到統(tǒng)計(jì)量T的計(jì)算:
假設(shè)總體均值為μ的正太母群體中的n個(gè)樣本的均值為xˉ,樣本標(biāo)準(zhǔn)差為s,計(jì)算得
T=(xˉ?μ)n?1????s
服從自由度(n?1)的t分布

t分布的形狀和正態(tài)分布類似,但是t分布更加緩和,中間頂端略低,兩端略高

利用t分布估計(jì)正太母群體的總體均值的方法:
1. 首先計(jì)算樣本均值xˉ,并計(jì)算樣本方差s2
2. 利用樣本均值xˉ、樣本方差s2作自由度n?1的t分布的統(tǒng)計(jì)量T
T=(xˉ?μ)n?1????s
3. 確認(rèn)自由度n?1的95%的預(yù)測(cè)命中區(qū)間,作?αT+α的預(yù)測(cè)區(qū)間
4. 解

?α(xˉ?μ)n?1????s+α 中的 μ,即是95%置信區(qū)間

參考

《極簡統(tǒng)計(jì)學(xué)》、《概率論與數(shù)理統(tǒng)計(jì)》等著作

本文純屬個(gè)人整理,比較倉促,僅供參考,如有錯(cuò)誤之處還請(qǐng)批評(píng)指正,謝謝~

總結(jié)

以上是生活随笔為你收集整理的统计学基础整理的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。