双因素方差分析_多因素方差分析
總第173篇/張俊紅
01.前言
在前面我們講過簡單的單因素方差分析,這一篇我們講講雙因素方差分析以及多因素方差分析,雙因素方差分析是最簡單的多因素方差分析。
單因素分析就是只考慮一個因素會對要比較的均值產(chǎn)生影響,而多因素分析是有多個因素會對均值產(chǎn)生影響。
需要注意的是一個因素可能會有不同的水平值,即不同的取值。比如要判斷某一款藥對某種病癥有沒有效果,服用不同的劑量效果應該是不一樣的,雖然因素都是服藥這一個因素,但是不同的藥劑量代表不同的水平。
雙因素(多因素)方差分析又可以分為兩種,一種是有交互作用的,一種是沒有交互作用的。啥意思呢?什么是交互作用呢?
比如我們大家所熟知的,牛奶和藥是不可以一起吃的,如果單獨喝牛奶有助于身體蛋白質(zhì)的補充,如果單獨吃藥可以有助于治療病癥,但是牛奶和藥同時吃就會把兩者的作用抵消掉。這種兩者之間的相互作用就可以理解成是交互作用,當然了,有的時候交互是正向呢,有的時候是負向的。
02.無交互作用方差分析
現(xiàn)在有如下一份不同品牌不同地區(qū)的產(chǎn)品銷量數(shù)據(jù)表,想要看一下不同品牌和不同地區(qū)這兩個因素是否對銷量有顯著性影響:
我們先來看看無交互作用的雙因素方差分析具體怎么做呢,所謂的無交互也就是假設品牌和地區(qū)之間是沒有交互作用的,相互不影響,只是彼此單獨對銷量產(chǎn)生影響。
前面單因素方差分析中,我們是用F值去檢驗顯著性的,多因素方差分析也同樣是用F值.
F = 組間方差/組內(nèi)方差。
對于沒有交互作用的多因素,可以單純理解為多個單因素。也就是你可以單獨去看品牌對銷量的影響,然后再單獨去看地區(qū)對銷量的影響。
那單獨怎么看呢?這就回到了我們前面講過的單因素方差分析。
我們先來計算品牌的組內(nèi)平方和:
SSA?=?(每個品牌的均值?-?全部銷量均值)^2*每個品牌內(nèi)樣本數(shù)????=?(344.20-328.45)^2*5?+?(347.80-328.45)^2*5?+?(337.00-328.45)^2*5?+?(284.80-328.45)^2*5
????=?13004.55
我們再來計算地區(qū)的組內(nèi)平方和:
SSB?=?(每個地區(qū)的均值?-?全體銷量均值)^2*每個地區(qū)內(nèi)樣本數(shù)????=?(339.00-328.45)^2*4?+?(330.25-328.45)^2*4?+?(339.25-328.45)^2*4?+?(318.25-328.45)^2*4
????=?2011.7
接著我們來計算全部平方和:
SST?=?(每個值-總體均值)^2????=?17888.95
除此之外還有一個平方和:
SSE?=?SST?-?SSA?-?SSB這部分是除品牌和地區(qū)以外的其他因素所產(chǎn)生的,稱為隨機誤差平方和。
有了平方和以后,我們同樣需要求取均方,而均方 = 平方和/自由度。
SST的自由度 = 總水平數(shù) - 1 = 19
SSA的自由度 = 品牌的水平數(shù) - 1 = 3
SSB的自由度 = 地區(qū)的水平數(shù) - 1 = 4
SSE的自由度 = SSA的自由度*SSB的自由度 = 12
平方和有了,自由度也有了,均方MS也就可以求出來了,接下來進入到最重要的F值求取,
品牌因素的F值 = SSA/SSE
地區(qū)因素的F值 = SSB/SSE
最后可以通過查F值表獲得在置信度為95%的情況下時的F邊界值表,然后和實際的F值作比較,最后做出是否顯著的判斷。如下表:
03.有交互作用方差分析
某交通部門想要知道高峰期與路段是否會對汽車的行車時間有影響,通過人工采集得到了如下數(shù)據(jù):
本次分析需要考慮峰期與路段之間的交互作用,某些路段的峰期行車時間可能異常偏高或偏低等。
和無交互作用的多因素方差分析流程類似,我們先計算峰期的平方和:
SSA?=?(每個峰期內(nèi)的均值-總體均值)^2*每個峰期內(nèi)樣本數(shù)????=?(23.2-20.25)^2*10?+?(17.3-20.25)^2*10
????=?174.05
再來計算路段的平方和:
SSB?=?(每個路段內(nèi)的均值-總體均值)^2*每個路段內(nèi)樣本數(shù)????=?(22.4-20.25)^2*10?+?(18.1-20.25)^2*10
????=?92.45
再來計算交互作用的平方和:
SSAB?=?(每個路段&峰期內(nèi)的均值-該路段內(nèi)的均值-該峰期內(nèi)的均值+總體均值)^2*每個區(qū)間內(nèi)的樣本數(shù)?????=?(25.4-23.2-22.4+20.25)^2*5?+?(21-23.2-18.1+20.25)^2*5?+?(19.4-17.3-22.4+20.25)^2*5?+?(15.2-17.3-18.1+20.25)^2*5
?????=?0.05
接著計算全部平方和:
SST?=?(每個值-總體均值)^2????=?329.75
最后來計算誤差平方和:
SSE?=?SST?-?SSA?-?SSB?-?SSABSST的自由度 = 總樣本數(shù) - 1 = 19
SSA的自由度 = 峰期數(shù) - 1 = 1
SSB的自由度 = 路段數(shù) - 1 = 1
SSAB的自由度 = SSA的自由度*SSB的自由度 = 1
SSE的自由度 = SST的自由度 - SSA的自由度 - SSB的自由度 - SSAB的自由度
經(jīng)過求均方,查F表,就可得到如下表:
04.方差分析與回歸分析異同
上面通過以有無交互作用的雙因素方差分析為例,給大家把多因素方差分析中涉及到的計算過程都演示了一遍,實際工作中我們是不需要自己手動進行計算的,直接通過Excel、Python都可以計算得到。以后專門講解工具如何實現(xiàn)。
通過上面的多因素方差分析,我們就可以得出來不同因素對某一目標值(銷量/行車時間等)的影響情況,你可能會有這樣的疑問,那這和多元回歸有什么區(qū)別呢?多元回歸不也是求取多個x和一個y的關系么?那這兩個是一樣的嗎?
還是有些不太一樣的,方差分析只是告訴你某個因素的影響顯著不顯著,而沒有告你影響有多大,回歸分析是告訴你具體影響有多大。方差分析是一種定性分析,解決有沒有的問題;回歸分析是一種定量分析,解決有多少的問題。
你還可以看:
聊聊置信度與置信區(qū)間統(tǒng)計學的假設檢驗一元線性回歸分析方差分析卡方檢驗講解總結(jié)
以上是生活随笔為你收集整理的双因素方差分析_多因素方差分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: sql 计算两个小数乘积_数学家是如何计
- 下一篇: uuid怎么获取_我们经常说的限流应该怎