高等数理统计(五)
引言
【比較官方的簡介】數(shù)理統(tǒng)計學是一門以概率論為基礎,應用性很強的學科。它研究怎樣以有效的方式收集、 整理和分析帶有隨機性的數(shù)據(jù),以便對所考察的問題作出正確的推斷和預測,為采取正確的決策和行動提供依據(jù)和建議。數(shù)理統(tǒng)計不同于一般的資料統(tǒng)計,它更側重于應用隨機現(xiàn)象本身的規(guī)律性進行資料的收集、整理和分析。
【簡單的講】,就是通過樣本分析來推斷整體。
【意義或者重要性】在這個大數(shù)據(jù)時代,數(shù)據(jù)是非常重要的。怎樣挖掘數(shù)據(jù)內部的規(guī)律或者隱含的信息,變得尤為重要。當時我們是不可能獲得整體的數(shù)據(jù)的,所以我們只能通過抽取樣本,進而通過樣本來推斷整體的規(guī)律。
【目錄】
第一章、樣本與統(tǒng)計量
一、引言:
二、總體與樣本:
三、統(tǒng)計量:
四、常用分布:
第二章、參數(shù)估計
一、引言:
二、點估計——矩估計法:
三、點估計——極大似然估計:
四、估計量的優(yōu)良性準則
五、區(qū)間估計——正態(tài)分布
1、引入
2、單個正態(tài)總體參數(shù)的區(qū)間估計
3、兩個正態(tài)總體的區(qū)間估計
六、區(qū)間估計——非正態(tài)分布:
1、大樣本正態(tài)近似法
2、二項分布
3、泊松分布
第三章、假設檢驗
一、引言:
二、正態(tài)總體均值的假設檢驗
1、單正態(tài)總體 N(μ, σ2)均值 μ?的檢驗
(1) 雙邊檢驗 H0: μ = μ0;H1: μ≠μ0?
(2) 單邊檢驗 H0: μ = μ0;H1: μ>μ0
2、兩個正態(tài)總體 N(μ1, σ12) 和? N(μ2, σ22)均值的比較
(1) 雙邊檢驗 H0:?μ1?=?μ2;H1:?μ1≠μ2?
? ? (2) 單邊檢驗 H0:?μ1?>=?μ2;H1:?μ1<μ2?
(3) 單邊檢驗 H0:?μ1?<=?μ2;H1:?μ1>μ2?
三、正態(tài)總體方差的檢驗
1、單個正態(tài)總體方差的?χ2 檢驗
(1) H0: σ2?=σ02;H1: σ2?≠σ02
(2) H0: σ2?=σ02;H1: σ2?>σ02
(3)? H0:?σ2?≤σ02;H1:?σ2?>?σ02?(同2.)
2、兩正態(tài)總體方差比的?F 檢驗
(1).? H0: σ12?=?σ22;H1: σ12?≠ ?σ22.
?(2) H0: σ12?=?σ22;H1:?? ?σ12>?σ22
?(3) H0: σ12?≤?σ22;H1:?? ?σ12>?σ22
? 第四章、回歸分析
一、引言
二、一元線性回歸 1、一元線性回歸模型 2、回歸系數(shù)的最小二乘估計: 3、回歸方程的顯著性檢驗 (1)F 檢驗 (2)T?檢驗 ? ?(3)相關系數(shù)檢驗4、估計與預測
(1)?E(y0)的估計
(2)?y0的預測區(qū)間
? 三、廣義線性回歸模型
?
四、非線性回歸模型
? 第五章、方差分析
一、引言
二、單因子方差分析的統(tǒng)計模型 ? 三、平方和分解四、參數(shù)估計 1、點估計:正態(tài)分布的極大似然估計 2、置信區(qū)間 五、重復數(shù)不等情形 六、多重比較 1、效應差的置信區(qū)間 2、之后補充 七、方差齊性檢驗 1、Hartley檢驗
?
?
第五章、方差分析
一、引言:
方差分析是研究一種或多種因素的變化對試驗結果的觀測值是否有顯著影響,從而找出較優(yōu)的試驗條件或生產條件的一種常用數(shù)理統(tǒng)計方法。
【方差分析的另外一種提法】實際工作中我們經(jīng)常碰到多個正態(tài)總體均值的比較問題,處理這類問題通常采用所謂的方差分析方法;即不同因素水平產生多個正態(tài)分布,方差分析就是這多個正態(tài)分布進行分析。?
【例1】在飼料養(yǎng)雞增肥的研究中,某研究所提出三種飼料配方:A1是以魚粉為主的飼料,A2是以槐樹粉為主的飼料,A3是以苜蓿粉為主的飼料。為比較三種飼料的效果,特選 24 只相似的雛雞隨機均分為三組,每組各喂一種飼料,60天后觀察它們的重量。試驗結果如下表所示:??
? ??本例中,我們要比較的是三種飼料對雞的增肥作用是否相同。為此,把飼料稱為因子,記為A,三種不同的配方稱為因子A的三個水平,記為A1, A2, A3,使用配方Ai下第 j 只雞60天后的重量用yij表示,i=1, 2, 3,? j=1, 2,..., 10。我們的目的是比較三種飼料配方下雞的平均重量是否相等,為此,需要做一些基本假定,把所研究的問題歸結為一個統(tǒng)計問題,然后用方差分析的方法進行解決。
二、單因子方差分析的統(tǒng)計模型 :
? ??在例1中我們只考察了一個因子,稱其為單因子試驗。
??? 通常,在單因子試驗中,記因子為 A, 設其有r個水平,記為A1, A2,…, Ar,在每一水平下考察的指標可以看成一個總體 ,現(xiàn)有 r 個水平,故有 r 個總體, 假定:
1)每一總體均為正態(tài)總體,記為 N(μi ,σi2),????? i=1, 2,…, r ; 2)各總體的方差相同: ?σ12=σ22=…=σr2 =σ2 ; 3)從每一總體中抽取的樣本是相互獨立的, 即所有的試驗結果 yij 都相互獨立。 ?我們要比較各水平下的均值是否相同,
? ? ?即要對如下的一個假設進行檢驗:? H0 :μ1?=μ2?=…=μr ? ? ? ? ? ? ? ? ? ? ?(1)
??? ?備擇假設為 ?H1 :μ1, μ2, …, μr?不全相等
??? 在不會引起誤解的情況下, H1?通常可省略不寫。
??? 如果H0成立,因子A的r個水平均值相同,稱因子A的r個水平間沒有顯著差異,簡稱因子A不顯著;反之,當H0不成立時,因子A的r個水平均值不全相同,這時稱因子A的不同水平間有顯著差異,簡稱因子A顯著。
為對假設(1)進行檢驗,需要從每一水平下的總體抽取樣本,設從第i個水平下的總體獲得m個試驗結果,記 yij 表示第i個總體的第j次重復試驗結果。共得如下n=r×m個試驗結果:
yij, i=1, 2,…, r , j=1, 2, …, m,?其中r為水平數(shù),m為重復數(shù),i為水平編號,j 為重復編號。
在水平Ai下的試驗結果yij與該水平下的指標均值 μi? 一般總是有差距的,記 εij = yij-μi,eij? 稱為隨機誤差。于是有:yij = μi?+εij ? ? ? ? ? ? ? (2)
? (2)式稱為試驗結果 yij 的數(shù)據(jù)結構式。
【單因子方差分析的統(tǒng)計模型】
?
三、平方和分解:
1、通常在單因子方差分析中可將試驗數(shù)據(jù)列成如下表格形式:
2、組內偏差與組間偏差:
3、偏差平方和及其自由度:
?
【重要】偏差平方和與自由度的關系,接下來三個自由度都可由此推出!
4、總平方和分解公式
組內偏差平方和自由度計算如下:每組的自由度都為(m-1),則總共r組,所以總自由度為 (m-1)*r = m*r -r = n-r
?
5、檢驗方法
四、參數(shù)估計
在檢驗結果為顯著時,我們可進一步求出總均值μ?、各主效應ai和誤差方差σ2的估計
1、點估計:正態(tài)分布的極大似然估計
因為 E(Se)=?σ2?* (n-r) ;所以?E(Se/n)=?σ2?* (n-r)/n?≠?σ2 ,所以不滿足無偏性,更具體關于無偏性,可查看【第二章、參數(shù)估計-四、估計量的優(yōu)良性準則】
2、置信區(qū)間
紅框部分證明如下:根據(jù)【第一章、樣本與統(tǒng)計量-中心極限定理】證明如下:
?
【總結】在單因子試驗的數(shù)據(jù)分析中可得到如下三個結果:
? 因子是否顯著;
? 試驗的誤差方差σ2的估計;
? 諸水平均值μi的點估計與區(qū)間估計。在因子A顯著時,通常只需對較優(yōu)的水平均值作參數(shù)估計,在因子A不顯著場合,參數(shù)估計無需進行。
?
五、重復數(shù)不等情形
單因子方差分析并不要求每個水平下重復試驗次數(shù)全相等,在重復數(shù)不等場合的方差分析與重復數(shù)相等情況下的方差分析極為相似,只在幾處略有差別。
六、多重比較
1、效應差的置信區(qū)間:
如果方差分析的結果因子A顯著,則等于說有充分理由認為因子A各水平的效應不全相同,但這并不是說它們中一定沒有相同的。就指定的一對水平Ai與Aj,我們可通過求μi - μj的區(qū)間估計來進行比較。
這里的置信區(qū)間與兩樣本的t區(qū)間基本一致,區(qū)別在于這里σ2的估計使用了全部樣本而不僅僅是兩個水平Ai, Aj下的觀測值。
2、多重比較問題
?
七、方差齊性檢驗 1、Hartley檢驗在進行方差分析時要求r個方差相等,這稱為方差齊性。理論研究表明,當正態(tài)性假定不滿足時對F檢驗影響較小,即F檢驗對正態(tài)性的偏離具有一定的穩(wěn)健性,而F檢驗對方差齊性的偏離較為敏感。所以r個方差的齊性檢驗就顯得十分必要。
??? 所謂方差齊性檢驗是對如下一對假設作出檢驗:
很多統(tǒng)計學家提出了一些很好的檢驗方法,這里介紹幾個最常用的檢驗,它們是:
? Hartley檢驗,僅適用于樣本量相等的場合; ? Bartlett檢驗,可用于樣本量相等或不等的場合,但是每個樣本量不得低于5; ? 修正的Bartlett檢驗,在樣本量較小或較大、相等或不等場合均可使用。轉載于:https://www.cnblogs.com/mo-wang/p/5049384.html
總結
- 上一篇: Java 1.8 HashMap源码探究
- 下一篇: sqlserver操作geography