统计学习:方差分析(ANOVA2)
統計學習
最近在做信號處理的時候發現自己的理論知識不夠,因此,開始了理論的重學之路,特開此系列帖子,總結自己的學習收獲以及方便后來的小伙伴。
方差分析ANOVA
方差的分析,通常被叫做ANOVA,可以被應用于隨機變量來自于多于兩類樣本的情景。
.
當我們只有兩個樣本來源的時候,我們可以使用T-test 來檢驗關于樣本均值的假設,但當樣本數量大于兩個的時候,這就變得不可實現了。如果我們只是比較兩個均值,那么t-test(獨立樣本)會給出和ANOVA相同的結果
它被用來比較多于兩個樣本的均值。可以通過一個例子加深大家對它的理解。
單因素方差分析
例子:
假設我們要測試五種不同練習的效果。為了這個目的,我們招募了20個男人并且將他們分為5組,每組4個人,且每組分配的運動不同,在訓練幾周后,我們記錄了他們的體重。
上述是一個單因素均衡ANOVA的例子。
因為這里只有一個變量的效果被檢驗,因此被命名為單因素。同時每個小組都擁有相同數量的實驗個體,因此被叫做均衡。
最后,該檢驗的出發點是檢驗被試個體是相似還是不相似?
為什么不使用多樣本T-test?
正如上文提到的,T-test只能用在兩個均值的差異上。當有多于兩個的均值被檢驗是,不可能用很多個T-test來比較各個的均值和其他的均值。
但使用多項T-test會導致許多其他的并發的問題,因此在這種情況下,我們使用ANOVA。因此,任何時候當這里有多個群體的均值假設需要做的時候都可以使用這個技術。
單因素和雙因素方差分析
現在,我們可能會提出一些問題:我們討論的均值是什么,為什么要分析方差,以便得出關于均值的結論。
整個過程可以在實驗的幫助下明確。
讓我們研究下肥料對小麥產量的影響。我們針對五種品質不同的肥料將其應用到五塊小麥地上面。記錄每個地塊的產量,并觀察地塊間產量的差異。在這里,肥料是一個因素,肥料的不同品質稱為水平。
這是一個單品質或者說單因素方差分析因為這里只有一個因素,肥料的品質。我們可能也有興趣研究土地的肥力效應。這樣的話我們就有兩個因素了,肥料和土壤肥力。這是一個雙品質或者說雙因素方差分析的實例。相似地,加入第三個因子,這就會是一個三方向或者三因素方差分析了。
偶然因素以及確定因素
在之前描述的實驗中,從地塊獲得的產量可能是不同的,我們可能會因此得出這樣的結論:由于肥料質量的差異而導致了小麥產量的差異。
但小麥的產量差異也有可能是某些其他因素的結果,這些因素可以歸因于偶然,也有可能是超出了人類控制的一些因子。這個因素可以被解釋為“誤差”。因此,不同地塊之間,產量的差異或者不同可能來自于誤差。
因此,估計因為可確定的原因(樣本間的差異)和偶然的原因(樣本間的共性)導致的變化量應該分別得到,并且使用F-test進行比較,并依賴F值給出相應的結論。
假設
在ANOVA分析中,這里有幾個基本的假設。
- 誤差的期望值是0
- 每個誤差項的方差都相等
- 每個誤差項都是獨立的
- 他們都是正態分布
典型分析結果匯總表:
參考:
方差分析
方差分析表
探索ANOVA
總結
以上是生活随笔為你收集整理的统计学习:方差分析(ANOVA2)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: transporter上传卡正在交付_X
- 下一篇: 计算机辅助设计设计师理论知识试卷,计算机