方差分析中的“元”和“因素”是什么?
試驗中要考察的指標稱為試驗指標,影響試驗指標的條件稱為因素,因素所處的狀態稱為水平 (通常用于3個或更多水平時;如果只有2個水平考慮T-test);若試驗中只有一個因素改變則稱為單因素試驗,若有兩個因素改變則稱為雙因素試驗,若有多個因素改變則稱為多因素試驗。
方差分析就是對試驗數據進行分析,檢驗方差相等的多個正態總體 均值是否相等,進而判斷各因素對試驗指標的影響是否顯著;根據影響試驗指標條件的個數可以區分為單因素方差分析、雙因素方差分析和多因素方差分析。(來源于:百度百科)
方差分析中的因素
方差分析中的因素通常是人為選定或可控的影響條件,如對樣品的人為處理、樣品自身的標記屬性等。不可控因素如病人的心情、試驗操作人的心情等一般不視為因素或不作為關注的因素;(還有一些不可控因素或通常認為不會帶來很多影響的因素,如不同的取樣時間、不同的RNA提取時間、提取人、細胞所處的分裂周期等;在某些情況下,如果我們記錄了這些因素并且關心這些因素時,也會變為方差分析中的因素)。
舉個例子,比如病人服用不同濃度藥物后基因表達變化試驗中:
基因表達是試驗指標;
藥物濃度是因素,假設有3個水平低濃度、中濃度和高濃度。
這就是單因素方差分析 (one-way ANOVA),比較病人服用不同濃度藥物后基因表達的均值是否相等;
如果同時考慮病人的年齡的影響,則
年齡也是因素,有多個水平比如幼年、青年、成年、老年等。
這就是兩因素方差分析 (two-way ANOVA),比較用藥濃度和年齡對基因表達變化的影響,稱為“主效應”影響;有時還需要同時比較濃度+年齡組成的新變量對基因表達變化的影響,稱為“交互效應”影響。(如果只是比較濃度+年齡組成的新變量對基因表達變化的影響,就又是單因素方差分析了)
如果再考慮病人的籍貫、藥物種類、吃藥時間、病人Marker突變等的影響,就是多因素方差分析了。
方差分析中的試驗指標
試驗中要考察的指標稱為試驗指標。在上面的例子中基因表達是一個試驗指標,不過很籠統,默認為是單個基因的表達,稱為一元方差分析。
那如果是關注兩個基因或所有基因的表達變化整體是否有差異呢?
這就是多元方差分析,每組樣本不是只包含一個試驗指標而是多個試驗指標。
表現在數據形式上:
(一元)方差分析是比較多組向量的均值是否存在顯著差異。
多元方差分析是比較多組矩陣的均值是否存在顯著差異。
因此,比較多組樣本整體基因表達的差異、多組樣本整體菌群構成的差異,就需要多元方差分析了。
多元方差分析
在統計學中,多元方差分析 (MANOVA, multivariate analysis of variance) 是一種對多個分組中檢測了多個指標變量 (這里的變量等同于上面的指標;如每個樣本中每個物種的豐度信息、每個樣本中每個基因的表達信息)的樣本整體均值的檢驗方法 ?。作為一個多變量過程,它在有兩個或多個因變量時使用,并且通常會分別涉及各個因變量的顯著性檢驗。它有助于回答:
自變量 (因素)的變化是否對因變量 (試驗指標)有顯著影響?
因變量之間有什么關系?
自變量之間有什么關系?
注: 對應上面 - 所有的因素都是自變量 (independent variable),而試驗指標是因變量 (dependent variable)。這在看英文文獻或不同教程時需要注意描述差異。
多元方差分析 (MANOVA, multivariate analysis of variance)的前提假設可類比于一元方差分析 (觀測指標值的獨立性、正態性、方差齊性)
數據獨立性。
每個分組內的檢測指標符合多元正態分布。
每個分組內的檢測指標的協方差矩陣一致。
但在很多生物、生態和環境數據集中,多元方差分析的前提假設通常難以滿足。
一些魯棒性更強、對數據分布依賴更少的檢驗方法被提出來并且獲得廣泛應用,如ANOSIM (analysis of similarities), PERMANOVA (permutational multivariate analysis of variance) (也稱為NPMANOVA, non-parametric MNOAVA), 和Mantel test。這些方法都通過一個樣本間的距離矩陣或相似性矩陣構建ANOVA分析類似的統計量,然后對每組的觀測結果進行隨機置換來計算顯著性P-value。對于單因素分析,對數據唯一的假設條件就是觀察指標數據存在可置換性 (exchangeability)。
下面我們再介紹如何應用PERMANOVA來檢驗PcOA等的結果的顯著性。
往期精品(點擊圖片直達文字對應教程)
機器學習
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
總結
以上是生活随笔為你收集整理的方差分析中的“元”和“因素”是什么?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深入理解内存(3):内存交换技术,虚拟内
- 下一篇: deb和rpm文件安装