差异表达基因变化倍数_10.limma教程|差异表达统计相关理论
點擊上方“藍字”關(guān)注我們
10.1 Top-Tables ?簡介limma包提供topTable和decideTests函數(shù)概括線性模型結(jié)果,進行假設(shè)檢驗,調(diào)整p值進行多重檢驗。結(jié)果包括(log2)倍數(shù)變化,標(biāo)準(zhǔn)誤差,t統(tǒng)計和p值。用于顯著性分析的基本統(tǒng)計量是修正t統(tǒng)計量,它是為每個探針和每個對比計算的。與普通t統(tǒng)計說明相同,除了標(biāo)準(zhǔn)誤差是在基因間被調(diào)節(jié),例如,使用簡單的貝葉斯模型縮放到一個相同的值。它的作用是從基因集合中借用信息來幫助推斷每個基因。修正t統(tǒng)計與普通t統(tǒng)計產(chǎn)生p值的方式相同,只是自由度增加了,反映了與平滑標(biāo)準(zhǔn)誤差相關(guān)的更大的可靠性。
函數(shù)topTable提供了頂部差異基因和所選對比度的信息匯總。logFC列給出了對比的值, 通常這表示兩個或多個實驗條件之間的log2倍數(shù)變化,盡管有時它表示一個log2表達水平。AveExpr列給出了該基因在實驗中所有陣列和通道中的平均log2表達水平。t列是修正t統(tǒng)計值。p值列是相關(guān)的p值,adj.P ?值是多重檢驗的P值。最常見的調(diào)整是用Benjamini and Hochberg’s method來控制錯誤發(fā)現(xiàn)率。如果目的是控制和估計錯誤發(fā)現(xiàn)率,這個調(diào)整值通常叫q值。如果所有q值都低于閾值0.05的基因作為差異表達基因,那么在這個挑選出來的組中錯誤發(fā)現(xiàn)的預(yù)期比率都將控制在這個閾值之下。這一步驟與Benjamini and Hochberg’s method是一樣的,雖然原文并沒有按照調(diào)整后的p值來制定方法。
B統(tǒng)計量(lods or B)是差異表達基因的log-odds 。假設(shè)B = 1:5,差異表達的幾率是exp(1.5)=4.48,基因發(fā)生差異表達的可能性是4.48/(1+4.48)=0.82 ,B=0代表該基因有50%的幾率發(fā)生差異表達。B值在多重檢驗中通過假設(shè)1%的基因或者一些由用戶調(diào)用eBayes來設(shè)定特定的百分比是差異表達的自動調(diào)整。正常來說,P值和B值對差異基因的排列是相同的。事實上,如果數(shù)據(jù)沒有缺失值或質(zhì)量權(quán)重,那么順序?qū)⑼耆嗤?/p>
eBayes函數(shù)計算另一個有用的統(tǒng)計量。修正F -統(tǒng)計量(F)將所有差異的t-統(tǒng)計量合并為該基因的總體顯著性檢驗。F統(tǒng)計檢驗該基因的任何對比是否非零,例如:該基因在任何對比中是否有差異表達。分母自由度與修正t相同。它的p值存儲在fit$F.p.value。它與方差分析中的普通F統(tǒng)計量相似,不同之處在于分母的均方差在不同基因間得到了調(diào)節(jié)。
10.2 線性模型和多重檢驗lmFit函數(shù)輸出的對象是MArrayLM 。該函數(shù)的輸出結(jié)果為計算線性模型所得的殘差、自由度、方差等結(jié)果。lmFit(object, design=NULL, ndups=1, spacing=1, block=NULL, correlation, weights=NULL, method="ls", ...)輸出結(jié)果:fit存儲殘差值,df.residual存儲自由度。多重檢驗是同時評估多個假設(shè)的情況,在生物芯片數(shù)據(jù)分析中是一種關(guān)鍵的統(tǒng)計學(xué)方法。當(dāng)分析生物芯片數(shù)據(jù)時,對多個基因進行統(tǒng)計學(xué)檢驗,并且根據(jù)標(biāo)準(zhǔn)p值識別可能差異表達的基因。但是,由于p值的多樣性和多重條件,在實驗中進行檢驗的假設(shè)總次數(shù)會很多,此時會增加第一類錯誤發(fā)生的概率。函數(shù)decideTests() ?提供了解決方法。decideTests(object, method = "separate", adjust.method = "BH", p.value = 0.05, lfc = 0, ...)?decideTests(object, method = "separate", adjust.method = "BH", p.value = 0.05, lfc = 0, coefficients = NULL, cor.matrix = NULL, tstat = NULL, df = Inf, genewise.p.value = NULL, ...)參數(shù)method可選的策略有:1.method="separate" ?:等同于topTable,能夠?qū)γ恳粋€對比進行單獨的檢驗,但是不能在對比之間進行檢驗2.method="global" ?:對測得的數(shù)據(jù)進行檢驗,不區(qū)分陣列或探針3.method="hierarchical":用于族錯誤率(family-wise error rate)校正?4.method="nestedF":?在探針?biāo)叫Ue誤發(fā)現(xiàn)率(false discovery rate)?編輯:洪爍校審:羅鵬總結(jié)
以上是生活随笔為你收集整理的差异表达基因变化倍数_10.limma教程|差异表达统计相关理论的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: matlab欧拉法程序,欧拉法matla
- 下一篇: java 安全 认证和授权,Java安全