双因素方差分析_多因素方差分析
總第173篇/張俊紅
01.前言
在前面我們講過(guò)簡(jiǎn)單的單因素方差分析,這一篇我們講講雙因素方差分析以及多因素方差分析,雙因素方差分析是最簡(jiǎn)單的多因素方差分析。
單因素分析就是只考慮一個(gè)因素會(huì)對(duì)要比較的均值產(chǎn)生影響,而多因素分析是有多個(gè)因素會(huì)對(duì)均值產(chǎn)生影響。
需要注意的是一個(gè)因素可能會(huì)有不同的水平值,即不同的取值。比如要判斷某一款藥對(duì)某種病癥有沒(méi)有效果,服用不同的劑量效果應(yīng)該是不一樣的,雖然因素都是服藥這一個(gè)因素,但是不同的藥劑量代表不同的水平。
雙因素(多因素)方差分析又可以分為兩種,一種是有交互作用的,一種是沒(méi)有交互作用的。啥意思呢?什么是交互作用呢?
比如我們大家所熟知的,牛奶和藥是不可以一起吃的,如果單獨(dú)喝牛奶有助于身體蛋白質(zhì)的補(bǔ)充,如果單獨(dú)吃藥可以有助于治療病癥,但是牛奶和藥同時(shí)吃就會(huì)把兩者的作用抵消掉。這種兩者之間的相互作用就可以理解成是交互作用,當(dāng)然了,有的時(shí)候交互是正向呢,有的時(shí)候是負(fù)向的。
02.無(wú)交互作用方差分析
現(xiàn)在有如下一份不同品牌不同地區(qū)的產(chǎn)品銷(xiāo)量數(shù)據(jù)表,想要看一下不同品牌和不同地區(qū)這兩個(gè)因素是否對(duì)銷(xiāo)量有顯著性影響:
我們先來(lái)看看無(wú)交互作用的雙因素方差分析具體怎么做呢,所謂的無(wú)交互也就是假設(shè)品牌和地區(qū)之間是沒(méi)有交互作用的,相互不影響,只是彼此單獨(dú)對(duì)銷(xiāo)量產(chǎn)生影響。
前面單因素方差分析中,我們是用F值去檢驗(yàn)顯著性的,多因素方差分析也同樣是用F值.
F = 組間方差/組內(nèi)方差。
對(duì)于沒(méi)有交互作用的多因素,可以單純理解為多個(gè)單因素。也就是你可以單獨(dú)去看品牌對(duì)銷(xiāo)量的影響,然后再單獨(dú)去看地區(qū)對(duì)銷(xiāo)量的影響。
那單獨(dú)怎么看呢?這就回到了我們前面講過(guò)的單因素方差分析。
我們先來(lái)計(jì)算品牌的組內(nèi)平方和:
SSA?=?(每個(gè)品牌的均值?-?全部銷(xiāo)量均值)^2*每個(gè)品牌內(nèi)樣本數(shù)????=?(344.20-328.45)^2*5?+?(347.80-328.45)^2*5?+?(337.00-328.45)^2*5?+?(284.80-328.45)^2*5
????=?13004.55
我們?cè)賮?lái)計(jì)算地區(qū)的組內(nèi)平方和:
SSB?=?(每個(gè)地區(qū)的均值?-?全體銷(xiāo)量均值)^2*每個(gè)地區(qū)內(nèi)樣本數(shù)????=?(339.00-328.45)^2*4?+?(330.25-328.45)^2*4?+?(339.25-328.45)^2*4?+?(318.25-328.45)^2*4
????=?2011.7
接著我們來(lái)計(jì)算全部平方和:
SST?=?(每個(gè)值-總體均值)^2????=?17888.95
除此之外還有一個(gè)平方和:
SSE?=?SST?-?SSA?-?SSB這部分是除品牌和地區(qū)以外的其他因素所產(chǎn)生的,稱(chēng)為隨機(jī)誤差平方和。
有了平方和以后,我們同樣需要求取均方,而均方 = 平方和/自由度。
SST的自由度 = 總水平數(shù) - 1 = 19
SSA的自由度 = 品牌的水平數(shù) - 1 = 3
SSB的自由度 = 地區(qū)的水平數(shù) - 1 = 4
SSE的自由度 = SSA的自由度*SSB的自由度 = 12
平方和有了,自由度也有了,均方MS也就可以求出來(lái)了,接下來(lái)進(jìn)入到最重要的F值求取,
品牌因素的F值 = SSA/SSE
地區(qū)因素的F值 = SSB/SSE
最后可以通過(guò)查F值表獲得在置信度為95%的情況下時(shí)的F邊界值表,然后和實(shí)際的F值作比較,最后做出是否顯著的判斷。如下表:
03.有交互作用方差分析
某交通部門(mén)想要知道高峰期與路段是否會(huì)對(duì)汽車(chē)的行車(chē)時(shí)間有影響,通過(guò)人工采集得到了如下數(shù)據(jù):
本次分析需要考慮峰期與路段之間的交互作用,某些路段的峰期行車(chē)時(shí)間可能異常偏高或偏低等。
和無(wú)交互作用的多因素方差分析流程類(lèi)似,我們先計(jì)算峰期的平方和:
SSA?=?(每個(gè)峰期內(nèi)的均值-總體均值)^2*每個(gè)峰期內(nèi)樣本數(shù)????=?(23.2-20.25)^2*10?+?(17.3-20.25)^2*10
????=?174.05
再來(lái)計(jì)算路段的平方和:
SSB?=?(每個(gè)路段內(nèi)的均值-總體均值)^2*每個(gè)路段內(nèi)樣本數(shù)????=?(22.4-20.25)^2*10?+?(18.1-20.25)^2*10
????=?92.45
再來(lái)計(jì)算交互作用的平方和:
SSAB?=?(每個(gè)路段&峰期內(nèi)的均值-該路段內(nèi)的均值-該峰期內(nèi)的均值+總體均值)^2*每個(gè)區(qū)間內(nèi)的樣本數(shù)?????=?(25.4-23.2-22.4+20.25)^2*5?+?(21-23.2-18.1+20.25)^2*5?+?(19.4-17.3-22.4+20.25)^2*5?+?(15.2-17.3-18.1+20.25)^2*5
?????=?0.05
接著計(jì)算全部平方和:
SST?=?(每個(gè)值-總體均值)^2????=?329.75
最后來(lái)計(jì)算誤差平方和:
SSE?=?SST?-?SSA?-?SSB?-?SSABSST的自由度 = 總樣本數(shù) - 1 = 19
SSA的自由度 = 峰期數(shù) - 1 = 1
SSB的自由度 = 路段數(shù) - 1 = 1
SSAB的自由度 = SSA的自由度*SSB的自由度 = 1
SSE的自由度 = SST的自由度 - SSA的自由度 - SSB的自由度 - SSAB的自由度
經(jīng)過(guò)求均方,查F表,就可得到如下表:
04.方差分析與回歸分析異同
上面通過(guò)以有無(wú)交互作用的雙因素方差分析為例,給大家把多因素方差分析中涉及到的計(jì)算過(guò)程都演示了一遍,實(shí)際工作中我們是不需要自己手動(dòng)進(jìn)行計(jì)算的,直接通過(guò)Excel、Python都可以計(jì)算得到。以后專(zhuān)門(mén)講解工具如何實(shí)現(xiàn)。
通過(guò)上面的多因素方差分析,我們就可以得出來(lái)不同因素對(duì)某一目標(biāo)值(銷(xiāo)量/行車(chē)時(shí)間等)的影響情況,你可能會(huì)有這樣的疑問(wèn),那這和多元回歸有什么區(qū)別呢?多元回歸不也是求取多個(gè)x和一個(gè)y的關(guān)系么?那這兩個(gè)是一樣的嗎?
還是有些不太一樣的,方差分析只是告訴你某個(gè)因素的影響顯著不顯著,而沒(méi)有告你影響有多大,回歸分析是告訴你具體影響有多大。方差分析是一種定性分析,解決有沒(méi)有的問(wèn)題;回歸分析是一種定量分析,解決有多少的問(wèn)題。
你還可以看:
聊聊置信度與置信區(qū)間統(tǒng)計(jì)學(xué)的假設(shè)檢驗(yàn)一元線(xiàn)性回歸分析方差分析卡方檢驗(yàn)講解總結(jié)
以上是生活随笔為你收集整理的双因素方差分析_多因素方差分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: sql 计算两个小数乘积_数学家是如何计
- 下一篇: uuid怎么获取_我们经常说的限流应该怎