UA MATH571B 试验设计VI 随机效应与混合效应1
UA MATH571B 試驗設計VI 隨機效應與混合效應
- 兩個factor的隨機效應模型
現在回到試驗設計III 單因素試驗設計1中介紹的模型,yij=μ+τi+?ij,?ij~iidN(0,σ2)i=1,2,?,a;j=1,2,?,ny_{ij} = \mu + \tau_i + \epsilon_{ij},\epsilon_{ij}\sim_{iid}N(0,\sigma^2)\\ i = 1,2,\cdots,a; j=1,2,\cdots,n yij?=μ+τi?+?ij?,?ij?~iid?N(0,σ2)i=1,2,?,a;j=1,2,?,n
其中μ\muμ是總體均值(grand mean),τi\tau_iτi?是第iii種factor level的treatment effect,μi=μ+τi\mu_i=\mu+\tau_iμi?=μ+τi?,這個模型叫效應模型(effect model)。我們想研究的是單個treatment factor的不同level對response的影響。用最小二乘法估計這個模型的時候,我們得到的方程是
anμ^+∑i=1aτ^i=y..nμ^+nτ^i=yi.,i=1,?,aan\hat{\mu}+\sum_{i=1}^a \hat{\tau}_i=y_{..}\\n\hat{\mu}+ n\hat{\tau}_i=y_{i.},i=1,\cdots,aanμ^?+i=1∑a?τ^i?=y..?nμ^?+nτ^i?=yi.?,i=1,?,a
線性獨立的方程只有aaa個,但要估計的系數有a+1a+1a+1個,因此我們為了估計系數引入了一個假設:
∑i=1aτ^i=0\sum_{i=1}^a \hat{\tau}_i = 0 i=1∑a?τ^i?=0
并稱滿足這個方程的factor為fixed factor。引入這個假設意味著我們認為treatment factor的level是人為設計,并且包含了treatment factor的絕大多數可能性,這樣的因素模型我們稱之為固定效應模型。固定效應模型中缺一個方程的原因是總體均值與treatment effec的線性相關性,除了增加額外的約束外,還可以考慮增加模型的隨機性。固定模型要求窮盡treatment factor所有取值是可能實現的,那么當treatment factor有非常多的可能的值時,樣本中的treatment factor level其實是對level的population的抽樣,treatment effect也就不會是固定的,而是與treatment factor level一樣是隨機的。稱factor level和factor effect是隨機變量的factor為random factor,只含有random factor的模型為隨機效應模型;同時含有random factor與fixed factor的模型為混合效應模型。
兩個factor的隨機效應模型
假設我們關注A和B兩個factor的effects,它們都是random factors,模型設定為:
yijk=μ+τi+βj+(τβ)ij+?ijk?ijk~iidN(0,σ2);i=1,?,a;j=1,?,b;k=1,?,nτi~iidN(0,στ2),βj~iidN(0,σβ2),(τβ)ij~iidN(0,στβ2)y_{ijk} = \mu + \tau_i + \beta_j +(\tau \beta)_{ij}+ \epsilon_{ijk}\\ \epsilon_{ijk} \sim_{iid}N(0,\sigma^2);i=1,\cdots,a;j=1,\cdots,b;k=1,\cdots,n \\ \tau_i \sim_{iid} N(0,\sigma_{\tau}^2),\beta_j \sim_{iid} N(0,\sigma^2_{\beta}),(\tau \beta)_{ij} \sim_{iid} N(0,\sigma_{\tau \beta}^2) yijk?=μ+τi?+βj?+(τβ)ij?+?ijk??ijk?~iid?N(0,σ2);i=1,?,a;j=1,?,b;k=1,?,nτi?~iid?N(0,στ2?),βj?~iid?N(0,σβ2?),(τβ)ij?~iid?N(0,στβ2?)
從而方差分解為:
Var(yijk)=στ2+σβ2+στβ2+σ2Var(y_{ijk}) = \sigma^2_{\tau} + \sigma^2_{\beta} + \sigma^2_{\tau \beta} + \sigma^2Var(yijk?)=στ2?+σβ2?+στβ2?+σ2
因素模型中我們討論的最基本的問題永遠是某個因素對試驗結果是否存在顯著的效應,具體表現為在總體均值以外,因素的不同水平是否會造成試驗結果的顯著區別。在固定效應模型中,我們比較的方式是用ANOVA做多組level的effect均值的檢驗,比較他們是否同時顯著為0;在隨機效應模型中,不同level的effect相同則意味著factor effect的方差為0,因此隨機效應模型中我們需要做的檢驗是:
H0:στ2=0H0:σβ2=0H0:στβ2=0H_0:\sigma_{\tau}^2=0 \\ H_0:\sigma_{\beta}^2=0\\ H_0:\sigma_{\tau \beta}^2=0H0?:στ2?=0H0?:σβ2?=0H0?:στβ2?=0
接下來,我們要試圖修正之前一直在用的ANOVA分析框架使之能夠用在隨機效應模型中。先定義幾個符號:
yi..=∑j=1b∑k=1nyijk,yˉi..=yi..any.j.=∑i=1a∑k=1nyijk,yˉ.j.=y.j.bnyij.=∑k=1nyijk,yˉij.=yij.ny...=∑i=1ayi..=∑j=1by.j.,yˉ...=y...N,N=abny_{i..} = \sum_{j=1}^b\sum_{k=1}^n y_{ijk}, \bar{y}_{i..} = \frac{y_{i..}}{an} \\ y_{.j.} = \sum_{i=1}^a \sum_{k=1}^n y_{ijk}, \bar{y}_{.j.} = \frac{y_{.j.}}{bn} \\ y_{ij.} = \sum_{k=1}^n y_{ijk}, \bar{y}_{ij.} = \frac{y_{ij.}}{n}\\ y_{...} = \sum_{i=1}^a y_{i..}=\sum_{j=1}^b y_{.j.}, \bar{y}_{...} = \frac{y_{...}}{N},N=abn yi..?=j=1∑b?k=1∑n?yijk?,yˉ?i..?=anyi..??y.j.?=i=1∑a?k=1∑n?yijk?,yˉ?.j.?=bny.j.??yij.?=k=1∑n?yijk?,yˉ?ij.?=nyij.??y...?=i=1∑a?yi..?=j=1∑b?y.j.?,yˉ?...?=Ny...??,N=abn
考慮平方和分解,總平方和為:
SST=∑i=1a∑j=1b∑k=1n(yijk?yˉ...)2SST = \sum_{i=1}^a \sum_{j=1}^b \sum_{k=1}^n (y_{ijk}-\bar{y}_{...})^2 SST=i=1∑a?j=1∑b?k=1∑n?(yijk??yˉ?...?)2
做一個替換
yijk?yˉ...=(yˉi..?yˉ...)+(yˉ.j.?yˉ...)+(yˉij.?yˉi..?yˉ.j.+yˉ...)+(yijk?yˉij.)y_{ijk} - \bar{y}_{...} = (\bar{y}_{i..}-\bar{y}_{...}) + (\bar{y}_{.j.}-\bar{y}_{...}) + (\bar{y}_{ij.}-\bar{y}_{i..} -\bar{y}_{.j.} + \bar{y}_{...} ) + (y_{ijk} - \bar{y}_{ij.}) yijk??yˉ?...?=(yˉ?i..??yˉ?...?)+(yˉ?.j.??yˉ?...?)+(yˉ?ij.??yˉ?i..??yˉ?.j.?+yˉ?...?)+(yijk??yˉ?ij.?)
可以自行驗證下面的結果:
SST=bn∑i=1n(yˉi..?yˉ...)2+an∑j=1b(yˉ.j.?yˉ...)2+n∑i=1a∑j=1b(yˉij.?yˉi..?yˉ.j.+yˉ...)2+∑i=1a∑j=1b∑k=1n(yijk?yˉij.)2SST = bn \sum_{i=1}^n(\bar{y}_{i..}-\bar{y}_{...})^2 + an\sum_{j=1}^b(\bar{y}_{.j.}-\bar{y}_{...})^2 + n\sum_{i=1}^a\sum_{j=1}^b (\bar{y}_{ij.}-\bar{y}_{i..} -\bar{y}_{.j.} + \bar{y}_{...} )^2 +\sum_{i=1}^a\sum_{j=1}^b\sum_{k=1}^n (y_{ijk} - \bar{y}_{ij.})^2SST=bni=1∑n?(yˉ?i..??yˉ?...?)2+anj=1∑b?(yˉ?.j.??yˉ?...?)2+ni=1∑a?j=1∑b?(yˉ?ij.??yˉ?i..??yˉ?.j.?+yˉ?...?)2+i=1∑a?j=1∑b?k=1∑n?(yijk??yˉ?ij.?)2
定義等式右邊的平方和為SSA,SSB,SSAB,SSESS_A,SS_B,SS_{AB},SSESSA?,SSB?,SSAB?,SSE,則平方和分解為
SST=SSA+SSB+SSAB+SSESST = SS_A + SS_B + SS_{AB} + SSESST=SSA?+SSB?+SSAB?+SSE
總平方和的自由度為dfT=N?1df_T = N-1dfT?=N?1,SSASS_ASSA?的自由度為dfA=a?1df_A = a-1dfA?=a?1,SSBSS_BSSB?的自由度為dfB=b?1df_B = b-1dfB?=b?1,SSABSS_{AB}SSAB?的表達式中包含的約束為
∑j=1byˉij.=byˉi..,i=1,?,a;∑i=1ayˉij.=ayˉ.j.,j=1,?,b;nyˉ...=∑i=1ayi..=∑j=1by.j.\sum_{j=1}^b \bar{y}_{ij.} = b\bar{y}_{i..},i=1,\cdots,a; \sum_{i=1}^a \bar{y}_{ij.} = a\bar{y}_{.j.},j=1,\cdots,b; n\bar{y}_{...} = \sum_{i=1}^a y_{i..}=\sum_{j=1}^b y_{.j.}j=1∑b?yˉ?ij.?=byˉ?i..?,i=1,?,a;i=1∑a?yˉ?ij.?=ayˉ?.j.?,j=1,?,b;nyˉ?...?=i=1∑a?yi..?=j=1∑b?y.j.?
自由方程數目為a+b?1a+b-1a+b?1,因此
dfAB=ab?a?b+1=(a?1)(b?1)dfModel=dfA+dfB+dfAB=ab?1df_{AB} = ab - a - b + 1 = (a-1)(b-1) \\ df_{Model} = df_{A} + df_{B} + df_{AB} = ab - 1dfAB?=ab?a?b+1=(a?1)(b?1)dfModel?=dfA?+dfB?+dfAB?=ab?1
所以殘差的自由度為
dfE=dfT?dfModel=abn?ab=ab(n?1)df_E = df_T - df_{Model} = abn - ab = ab(n-1)dfE?=dfT??dfModel?=abn?ab=ab(n?1)
根據平方和與自由度可以定義均方和,下面是一些常用結果,可以自行驗證:
以上是ANOVA方法在隨機效應模型上的修正,ANOVA方法中主要用的估計量是最小二乘估計(其實也是矩估計);另一種估計方差的方法是最大似然估計,在隨機效應與混合效應模型中使用的最大似然估計稱為residual maximum likelihood (REML)模型,與ANOVA不同的是,ANOVA直接得到的是平方和的分解,而REML直接得到的是方差的估計,因此REML在計算方差的置信區間、做方差的假設檢驗等方面更便捷。
總結
以上是生活随笔為你收集整理的UA MATH571B 试验设计VI 随机效应与混合效应1的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Julia程序设计3 数组2 排序、复制
- 下一篇: UA MATH571B 试验设计VI 随