edger多组差异性分析_简单使用DESeq2/EdgeR做差异分析
DESeq2和EdgeR都可用于做基因差異表達(dá)分析,主要也是用于RNA-Seq數(shù)據(jù),同樣也可以處理類似的ChIP-Seq,shRNA以及質(zhì)譜數(shù)據(jù)。
這兩個(gè)都屬于R包,其相同點(diǎn)在于都是對(duì)count data數(shù)據(jù)進(jìn)行處理,都是基于負(fù)二項(xiàng)分布模型。因此會(huì)發(fā)現(xiàn),用兩者處理同一組數(shù)據(jù),最后在相同閾值下篩選出的大部分基因都是一樣的,但是有一部分不同應(yīng)該是由于其估計(jì)離散度的不同方法所導(dǎo)致的。 ### DESeq2的使用方法:
輸入矩陣數(shù)據(jù),行名為sample,列名為gene;DESeq2不支持無生物學(xué)重復(fù)的數(shù)據(jù),因此我選擇了2個(gè)樣本,3個(gè)生物學(xué)重復(fù)的數(shù)據(jù);并對(duì)count data取整(經(jīng)大神指點(diǎn),這里需要說明下,我的測試數(shù)據(jù)readcount是RSEM定量的結(jié)果,并不是常見的htseq-count的結(jié)果,所以count值會(huì)有小數(shù)點(diǎn),而DESeq2包不支持count數(shù)有小數(shù)點(diǎn),所以這里需要round取整)。
database_all
database
type
database
設(shè)置分組信息以及構(gòu)建dds對(duì)象
condition
coldata
dds
使用DESeq函數(shù)進(jìn)行估計(jì)離散度,然后進(jìn)行標(biāo)準(zhǔn)的差異表達(dá)分析,得到res對(duì)象結(jié)果
dds
res
最后設(shè)定閾值,篩選差異基因,導(dǎo)出數(shù)據(jù)
table(res$padj <0.05)
res
resdata
write.csv(resdata,file = "LC_1_vs_LC_2.csv")
EdgeR的使用方法:
跟DESeq2一樣,EdgeR輸入矩陣數(shù)據(jù),行名為sample,列名為gene;DESeq2不支持無生物學(xué)重復(fù)的數(shù)據(jù),因此我選擇了2個(gè)樣本,3個(gè)生物學(xué)重復(fù)的數(shù)據(jù)。
exprSet_all
exprSet
group_list
設(shè)置分組信息,去除低表達(dá)量的gene以及做TMM標(biāo)準(zhǔn)化
exprSet 1) >= 2,]
exprSet
exprSet
使用qCML(quantile-adjusted conditional maximum likelihood)估計(jì)離散度(只針對(duì)單因素實(shí)驗(yàn)設(shè)計(jì))
exprSet
exprSet
尋找差異gene(這里的exactTest函數(shù)還是基于qCML并且只針對(duì)單因素實(shí)驗(yàn)設(shè)計(jì)),然后按照閾值進(jìn)行篩選即可
et
tTag
tTag
write.csv(tTag,file = "LC_1_vs_LC_2_edgeR.csv")
Summary
以上我主要針對(duì)單因素兩兩比較組進(jìn)行差異分析,其實(shí)DESeq2和EdgeR兩個(gè)R包都可以對(duì)多因素進(jìn)行差異分析。
DESeq2修改以上代碼的分組信息design參數(shù)以及在差異分析results函數(shù)中添加所選定的分組因素,其他代碼基本一樣,具體參照DESeq2手冊
EdgeR則需要用Cox-Reid profile-adjusted likelihood (CR)方法來估算離散度,y
總結(jié)
以上是生活随笔為你收集整理的edger多组差异性分析_简单使用DESeq2/EdgeR做差异分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 本地方法栈线程公有_Java运行时区域,
- 下一篇: 顺丰北京到北京多少钱啊?