UA MATH571B 试验设计 2k析因设计理论上
UA MATH571B 試驗設計 2k析因設計理論上
- 2k2^k2k析因設計
- 因子效應的計算
- ANOVA table
- Single-replicate 2k2^k2k析因設計
2k2^k2k析因設計(factorial design)在QE中幾乎是必考的內容,但經過上課作業(yè)考試以后感覺還是停留在入門的程度,不得已只能自學一下教材。2k2^k2k析因設計包括的內容是2k2^k2k析因設計的基本原理、Confounding和fractional 2k2^k2k析因設計,分上下兩篇博文介紹它們的概念和統(tǒng)計模型。
先澄清基本概念,2k2^k2k析因設計中的兩個關鍵詞,析因設計在UA MATH571B 試驗設計V 析因設計簡介中已經介紹過了,它與之前的RCBD最大的不同在于析因設計分析的treatment factor不止一個;2k2^k2k的含義是假設有kkk個treatment factor,那么每個factor我們只取兩個factor level來做試驗,一個level被稱為high level,另一個被稱為low level。
通常我們不會用2k2^k2k析因設計去做一個完整的試驗,而是把它作為一個研究的預試驗。它的好處是能夠以較少的試驗資源分析因子的重要性,幫助我們排除掉一些不重要的因子與效應,從而提高試驗效率并構建更準確的統(tǒng)計模型。
2k2^k2k析因設計
先來學習一下2k2^k2k析因設計中的treatment effect的記號。假設我們想要研究四個treatment factor,那么只有一個factor為high level的effect我們記為:a,b,c,d;兩個factor為high level的效應我們記為:ab, ac, ad, dc,db,cd;三個factor為high level的效應記為:abc, abd, acd, bcd;四個factor為high level的效應記為:abcd;比如a表示只有因素A為high level,BCD均為low level的effect;abd表示因素ABD均為high level,C為low level的effect,另外用(1)表示所有因素均為low level的effect。但通常我們不按照這個順序排列,我們按standard order來排列這些effect:
(1),a,b,ab,c,ac,bc,abc,d,ad,bd,abd,cd,acd,bcd,abcd(1), a, b, ab, c, ac, bc, abc, d, ad, bd, abd, cd, acd, bcd, abcd(1),a,b,ab,c,ac,bc,abc,d,ad,bd,abd,cd,acd,bcd,abcd
按字母順序排列,但新出現一個effect之后,要把它和以前的effect的組合也要寫上去。
這張表給出了分析2k2^k2k析因設計試驗結果的一般性步驟。首先計算treatment effect,然后用初始模型(full model,包含所有的effects和interactions)做一下統(tǒng)計分析,根據統(tǒng)計分析的結果,我們可以將不重要的factor或者interaction刪去,從而優(yōu)化統(tǒng)計模型,最后對優(yōu)化后的模型進行分析,為后續(xù)試驗提供指導。
因子效應的計算
在上面介紹的因子效應的表示方法使得每一個因子效應都可以表示成一個contract,以上面介紹的242^424設計為例,因子效應的一般表示為
(a±1)(b±1)(c±1)(d±1)(a \pm 1)(b \pm 1)(c \pm 1)(d \pm 1)(a±1)(b±1)(c±1)(d±1)
比如要計算因子AAA的效應就可以用
ContractA=(a?1)(b+1)(c+1)(d+1)Contract_A = (a - 1)(b +1)(c +1)(d+ 1) ContractA?=(a?1)(b+1)(c+1)(d+1)
比如因子ACACAC的交叉效應可以表示為
ContractAC=(a?1)(b+1)(c?1)(d+1)Contract_{AC} =(a - 1)(b + 1)(c - 1)(d+ 1) ContractAC?=(a?1)(b+1)(c?1)(d+1)
展開后各項就是treatment effect,這種操作能夠將因子效應用treatment effect表示出來(treatment effect是比較具體的,factor level combinations的effect)。根據Contract的性質可以把因子的平方和也計算出來,
SSAC=1n24ContractAC2SS_{AC} = \frac{1}{n2^4}Contract_{AC} ^2SSAC?=n241?ContractAC2?
其中nnn是獨立重復試驗次數。這種計算表示方法可以推廣至任意多個factor。
ANOVA table
下面是2k2^k2k析因設計的ANOVA table,有nnn次獨立重復試驗,kkk個factor的兩個level共有2k2^k2k中組合方式,因此總的試驗單位有n2kn2^kn2k。每種contract占一個自由度,因此所有的contract一種占2k2^k2k個自由度(就是上面contract的展開式的個數),所以殘差的自由度為2k(n?1)2^k(n-1)2k(n?1)。當只有一次重復試驗時,殘差沒有自由度,這時不能做ANOVA F檢驗;當有兩個及兩個以上自由度時,這時分析方法就是常規(guī)的ANOVA。
Single-replicate 2k2^k2k析因設計
畢竟2k2^k2k析因設計只是一個預實驗步驟,所以試驗資源能省則省,很多時候就只能做一個重復試驗,上面分析到只有一次重復試驗時,ANOVA是沒辦法用的,那我們又應該用什么工具來分析試驗結果呢?Daniel (1959)提出,我們可以用normal probability plot方法。根據上面已經介紹的方法,我們可以計算出因子效應的估計以及平方和。下圖是一個示例,第三行的percent contribution指的是因子的平方和相對總平方和的比值,其實從這個圖中我們已經可以看出點名堂了,顯然因子B的contribution是非常小的,連帶著包含B的交互效應也是比較小的。
下面我們假設因子的效應(第一列)是正態(tài)(或者至少是位置-尺度參數族)的,記其分布函數為FFF,將其從上到下記為e1.?,e15e_1.\cdots,e_{15}e1?.?,e15?,將其按從小到大的順序排序,記順序統(tǒng)計量為e(1),?,e(15)e_{(1)},\cdots,e_{(15)}e(1)?,?,e(15)?,它們對應理論概率估計值為(參考UA MATH571A 一元線性回歸IV 模型診斷介紹的正態(tài)概率估計值)
p^i=F(ei?μσ)=i+0.37515+0.25,i=1,?,15\hat p_i = F\left( \frac{e_{i}-\mu}{\sigma} \right) = \frac{i + 0.375}{15 + 0.25},i=1,\cdots,15p^?i?=F(σei??μ?)=15+0.25i+0.375?,i=1,?,15
作出(e(i),p^i)(e_{(i)},\hat p_i)(e(i)?,p^?i?)的圖像,這個就叫正態(tài)概率圖(normal probability plot),這個例子的正態(tài)概率圖如下圖所示
比較集中的那些因子效應說明都是不顯著的,我們可以把他們排除掉。位置比較偏的這幾個效應是顯著的,我們要保留下來,因此因子A,C,D,AC,AD被保留,我們優(yōu)化后的模型就是只包含這幾個效應的模型。利用原來的數據集對這個新的模型進行分析。因為因子B的影響非常小,所以它是high level還是low level沒有顯著區(qū)別,我們就可以把在因子B high level和low level下分別進行的兩次試驗看成是兩次獨立重復試驗,這樣nnn就等于2了,我們真正分析的試驗變成了232^323試驗。這時稱多出來的這個replicate叫做hidden replicate。
總結
以上是生活随笔為你收集整理的UA MATH571B 试验设计 2k析因设计理论上的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH564 概率论 QE练习题
- 下一篇: UA MATH571B 试验设计 2k析