UA MATH571B 2K析因设计 SAS实践 分数2k析因设计
UA MATH571B 2K析因設(shè)計 SAS實踐 分?jǐn)?shù)2k析因設(shè)計
- 試驗數(shù)據(jù)的定性分析
- 試驗數(shù)據(jù)的定量分析
這是2016年五月QE第三題。這道題的背景是1988年發(fā)在Journal of quality Technology的paper,Journal of quality Technology是制造業(yè)質(zhì)控技術(shù)領(lǐng)域的小top期刊。這篇文章要研究的就是最后這個詞組:filling variability。相信大家都買過即食湯包,比如紫菜湯包、番茄蛋花湯包等,開水泡一下就可以喝,非常方便;雖然對使用者很方便,制造商卻面臨一個很大的問題:出于質(zhì)控的目標(biāo),制造商希望每袋湯包灌裝之后重量幾乎是一樣的,但事實上每一袋的重量都不一樣。稱灌裝的湯包重量的差異程度叫做filling variation,質(zhì)檢合格的要求就是把filling variation控制在一定范圍內(nèi)。這篇paper就在試圖用一個案例回答filling variability由什么決定這個問題。在預(yù)實驗步驟,作者選擇了五個制作灌裝材料階段的factor,分別是攪拌的時候加幾次油、工作溫度、攪拌時間、批次重量、攪拌與灌裝間隔時間,被解釋變量是灌裝湯包重量的標(biāo)準(zhǔn)差,通過析因設(shè)計判斷每個因子的重要性。
試驗數(shù)據(jù)的定性分析
我們先定性分析一下試驗數(shù)據(jù),確定之后定量分析的思路與方法。第一列數(shù)據(jù)告訴我們試驗單位是16個,因為一共五個factor,每個factor取兩個level來做的試驗,如果是252^525設(shè)計,就應(yīng)該有32個試驗結(jié)果,但現(xiàn)在只有16,說明這是一個fractional factorial design,更準(zhǔn)確一點,是一個25?12^{5-1}25?1 Design。
下面分析這個試驗的Defining relation是什么。最簡單的方法是我們?nèi)稳∫恍?#xff0c;比如取第7行,然后用第七行的AAA到EEE這五個factor的值,用乘法/取相反數(shù)這兩種運算湊1,很明顯全部相乘再取相反數(shù)就是1,因此Defining relation是
I=?ABCDEI = -ABCDEI=?ABCDE
基于這個Defining relation,所有的一階效應(yīng)會與對應(yīng)的四階交互效應(yīng)互為alias(比如A和-BCDE);所有的二階交互效應(yīng)效應(yīng)會與對應(yīng)的三階交互效應(yīng)互為alias(比如AB和-CDE);因此所有的單個因子的效應(yīng)或兩個因子的交互效應(yīng)不會與單個因子的效應(yīng)或兩個因子的交互效應(yīng)互為alias,這是一個resolution V設(shè)計,或記為2V5?12^{5-1}_{V}2V5?1?。(相關(guān)理論參考UA MATH571B 試驗設(shè)計 2k析因設(shè)計理論下)
現(xiàn)在我們確定了這是一個unreplicated 2V5?12^{5-1}_{V}2V5?1?設(shè)計,接下來的分析思路就是估計因子效應(yīng),輔助正態(tài)概率圖判斷顯著的因子,排除掉不顯著的因子,簡化模型,再對簡化后的模型做統(tǒng)計分析。
試驗數(shù)據(jù)的定量分析
首先讀取數(shù)據(jù)
data soup; infile 'D:\Stat PhD\taking course\summer1\Method\2016May\soup.csv' delimiter=',' firstobs=2; input A B C D E y; run;proc print data = soup; run; /*查看輸入的數(shù)據(jù)是否正確*/因為是csv文件,所以用逗號分隔。下面的代碼是用來計算因子效應(yīng)的,基本思想是計算用上面的16種factor做回歸的系數(shù)乘2:
data effect0; set soup; AE = A*E; BE = B*E; AB = A*B; CE = C*E; AC = A*C; BC = B*C; ABCE = AB*CE; DE = D*E; AD = A*D; BD = B*D; ABD = AB*D; CD = C*D; ACDE = AC*DE; BCDE = BC*DE; ABCD = AB*CD; run;proc reg outest=effect1 data = effect0; model y = A B C D E AE BE AB CE AC BC ABCE DE AD BD ABD CD ACDE BCDE ABCD; run;data effect2; set effect1; drop y intercept _RMSE_; run;proc transpose data = effect2 out = effect3; run;data effect4; set effect3; effect = col1*2; run;proc sort data = effect4; by effect; run;proc transpose data = effect4 out = effect40; run;data effect5; set effect4; where _NAME_ ^= 'block'; run;proc print data = effect5; run;它輸出的結(jié)果如下,顯然效應(yīng)比較大的是E、BE、DE,并且是負效應(yīng),說明攪拌時間與灌裝時間間隔越久,灌裝誤差就會越小。其實也不難理解,隔得越久水就蒸發(fā)得越干,剩下的風(fēng)味物質(zhì)中差一兩片干紫菜總比差一兩片濕紫菜的誤差小。
下面畫出正態(tài)概率圖double check一下,
顯然左下方這三個點是偏離集中區(qū)域的,因此可以確定E、BE、DE的效應(yīng)是顯著的。因為BE、DE中也包含B、D這兩個因素,為了避免漏掉可能的顯著因子,我們分析B、D、E,BE、DE這五個因素。
總結(jié)
以上是生活随笔為你收集整理的UA MATH571B 2K析因设计 SAS实践 分数2k析因设计的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH 571B 回归 QE练习
- 下一篇: UA MATH566 统计理论7 还有一