高等数理统计(四)
引言
【比較官方的簡介】數理統計學是一門以概率論為基礎,應用性很強的學科。它研究怎樣以有效的方式收集、 整理和分析帶有隨機性的數據,以便對所考察的問題作出正確的推斷和預測,為采取正確的決策和行動提供依據和建議。數理統計不同于一般的資料統計,它更側重于應用隨機現象本身的規律性進行資料的收集、整理和分析。
【簡單的講】,就是通過樣本分析來推斷整體。
【意義或者重要性】在這個大數據時代,數據是非常重要的。怎樣挖掘數據內部的規律或者隱含的信息,變得尤為重要。當時我們是不可能獲得整體的數據的,所以我們只能通過抽取樣本,進而通過樣本來推斷整體的規律。
【目錄】
第一章、樣本與統計量
一、引言:
二、總體與樣本:
三、統計量:
四、常用分布:
第二章、參數估計
一、引言:
二、點估計——矩估計法:
三、點估計——極大似然估計:
四、估計量的優良性準則
五、區間估計——正態分布
1、引入
2、單個正態總體參數的區間估計
3、兩個正態總體的區間估計
六、區間估計——非正態分布:
1、大樣本正態近似法
2、二項分布
3、泊松分布
第三章、假設檢驗
一、引言:
二、正態總體均值的假設檢驗
1、單正態總體 N(μ, σ2)均值 μ?的檢驗
(1) 雙邊檢驗 H0: μ = μ0;H1: μ≠μ0?
(2) 單邊檢驗 H0: μ = μ0;H1: μ>μ0
2、兩個正態總體 N(μ1, σ12) 和? N(μ2, σ22)均值的比較
(1) 雙邊檢驗 H0:?μ1?=?μ2;H1:?μ1≠μ2?
? ? (2) 單邊檢驗 H0:?μ1?>=?μ2;H1:?μ1<μ2?
(3) 單邊檢驗 H0:?μ1?<=?μ2;H1:?μ1>μ2?
三、正態總體方差的檢驗
1、單個正態總體方差的?χ2 檢驗
(1) H0: σ2?=σ02;H1: σ2?≠σ02
(2) H0: σ2?=σ02;H1: σ2?>σ02
(3)? H0:?σ2?≤σ02;H1:?σ2?>?σ02?(同2.)
2、兩正態總體方差比的?F 檢驗
(1).? H0: σ12?=?σ22;H1: σ12?≠ ?σ22.
?(2) H0: σ12?=?σ22;H1:?? ?σ12>?σ22
?(3) H0: σ12?≤?σ22;H1:?? ?σ12>?σ22
? 第四章、回歸分析
一、引言
二、一元線性回歸 1、一元線性回歸模型 2、回歸系數的最小二乘估計: 3、回歸方程的顯著性檢驗 (1)F 檢驗 (2)T?檢驗 ? ?(3)相關系數檢驗4、估計與預測
(1)?E(y0)的估計
(2)?y0的預測區間
? 三、廣義線性回歸模型
?
四、非線性回歸模型
?
?
第四章、回歸分析
一、引言:
變量間的兩類關系:十九世紀,英國生物學家兼統計學家高爾頓研究發現:
? ? ?其中x表示父親身高, y 表示成年兒子的身高(單位:英寸,1英寸=2.54厘米)。這表明子代的平均高度有向中心回歸的意思,使得一段時間內人的身高相對穩定。之后回歸分析的思想滲透到了數理統計的其它分支中。
? 回歸分析處理的是變量與變量間的關系。變量間常見的關系有兩類:確定性關系與相關關系。 ? 變量間的相關關系不能用完全確切的函數形式表示,但在平均意義下有一定的定量關系表達式,尋找這種定量關系表達式就是回歸分析的主要任務。 ? 回歸分析便是研究變量間相關關系的一門學科。它通過對客觀事物中變量的大量觀察或試驗獲得的數據,去尋找隱藏在數據背后的相關關系,給出它們的表達形式——回歸函數的估計。 二、一元線性回歸 1、一元線性回歸模型設y與x間有相關關系,稱x為自變量(預報變量),y為因變量(響應變量),在知道x取值后,y有一個分布p(y|x),我們關心的是y的均值E(Y|x):
這便是y關于x的理論回歸函數——條件期望,也就是我們要尋找的相關關系的表達式。通常,相關關系可用下式表示:y =f (x)+?ε,其中ε是隨機誤差,一般假設ε ~N(0,σ2)。
進行回歸分析首先是回歸函數形式的選擇。當只有一個自變量時,通常可采用畫散點圖 的方法進行選擇。
【例1】合金的強度y (×107Pa) 與合金中碳的含量x (%) 有關。為研究兩個變量間的關系。首先是收集數據,我們把收集到的數據記為(xi,yi) ,i=1,2, ... , n。本例中,我們收集到12組數據,列于表1中
為找出兩個量間存在的回歸函數的形式,可以畫一張圖:把每一對數(xi,yi)看成直角坐標系中的一個點,在圖上畫出n個點,稱這張圖為散點圖,見圖1
從散點圖我們發現12個點基本在一條直線附近,這說明兩個變量之間有一個線性相關關系,這個相關關系可以表示為
??????????????????????? y =Β0+ Β1x+ ε? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (2)
??? 這便是y關于x的一元線性回歸的數據結構式。通常假定
??????????????????????? E(ε) =0,? Var(ε) = σ2???????????????????????????????????????????????????? ?(3)
??? 在對未知參數作區間估計或假設檢驗時,還需要假定誤差服從正態分布,即
??????????????????????? y ~N(Β0+?Β1x?, σ2?)???????????????????????????????? (4)
顯然,假定(4) 比 (3) 要強。
由于 Β0, Β1均未知,需要我們從收集到的數據(xi,yi),i=1,2,…,n,出發進行估計。在收集數據時,我們一般要求觀察獨立地進行,即假定y1, y2,…, yn,相互獨立。綜合上述諸項假定,我們可以給出最簡單、常用的一元線性回歸的數學模型:
由數據(xi,yi),i=1,2,…,n,可以獲得Β0, Β1的估計 ,稱
為y關于x的經驗回歸函數,簡稱為回歸方程,其圖形稱為回歸直線。給定x=x0后,?稱為回歸值(在不同場合也稱其為擬合值、預測值)。
2、回歸系數的最小二乘估計:
【例2】使用例1中合金鋼強度和碳含量數據,我們可求得回歸方程,見下表.
【性質】關于最小二乘估計的一些性質羅列在如下定理之中
【證明】定理1證明如下:
? 3、回歸方程的顯著性檢驗
在使用回歸方程作進一步的分析以前,首先應對回歸方程是否有意義進行判斷。如果Β1=0,那么不管x如何變化,E(y)不隨x的變化作線性變化,那么這時求得的一元線性回歸方程就沒有意義,稱回歸方程不顯著。如果Β1≠0,E(y)隨x的變化作線性變化,稱回歸方程是顯著的。
??? 綜上,對回歸方程是否有意義作判斷就是要作如下的顯著性檢驗:H0:Β1=0????? vs????? H1: Β1≠0 ?。拒絕H0表示回歸方程是顯著的。
在一元線性回歸中有三種等價的檢驗方法,下面分別加以介紹。
(1)F 檢驗:采用方差分析的思想,我們從數據出發研究各yi不同的原因。
?
【證明】公式(13)證明如下:
【推論】
?
? 關于SR 和 Se所含有的成分可由如下定理說明
進一步,有關SR 和 Se的分布,有如下定理。
如同方差分析那樣,我們可以考慮采用F比作為檢驗統計量:
【例3】在合金鋼強度的例2中,我們已求出了回歸方程,這里我們考慮關于回歸方程的顯著性檢驗。
?
(2)T?檢驗:
對H0 : Β1 =0的檢驗也可基于t分布進行。
(3)相關系數檢驗
一元線性回歸方程是反映兩個隨機變量x與y間的線性相關關系,它的顯著性檢驗還可通過對二維總體相關系數r的檢驗進行。(相關系數的概念可見【第一章------>三、統計量】)
【總結】在一元線性回歸場合,三種檢驗方法是等價的:在相同的顯著性水平下,要么都拒絕原假設,要么都接受原假設,不會產生矛盾。? F 檢驗可以很容易推廣到多元回歸分析場合,而其他二個則否,所以,F檢驗是最常用的關于回歸方程顯著性檢驗的檢驗方法。
? 4、估計與預測:
當回歸方程經過檢驗是顯著的后,可用來做估計和預測。這是二個不同的問題:
(1)?E(y0)的估計
在x=x0時,其對應的因變量y0是一個隨機變量,有一個分布,我們經常需要對該分布的均值給出估計。
(2) y0的預測區間
【詳細過程】
?
? 三、廣義線性回歸模型
?
四、非線性回歸模型
?
?
轉載于:https://www.cnblogs.com/mo-wang/p/4988754.html
總結
- 上一篇: 三、spring boot 1.5.4
- 下一篇: 步步为营-77-Ajax简介