单基因GSEA怎么做?
今天在討論群看到有群友提問?單基因GSEA怎么做?。之前也看到過這個概念,但一直不清楚這個單是什么含義,一直以為是用單個基因做GSEA。如果之前看過生信寶典的一文掌握GSEA,超詳細(xì)教程,一定會特別熟悉GSEA的原理和操作流程。當(dāng)然越是理解,越是想不明白單個基因怎么做GSEA。當(dāng)然如果您不熟悉GSEA,建議先看上一篇文章。
后來群友點撥理解了,不是對單個基因做GSEA,是拿單個基因 (一般是感興趣的基因)作為分組方式,探索與給定的單個基因相關(guān)的?(可以是表達(dá)相關(guān),也可以是其它相關(guān))基因富集在哪些調(diào)控通路和分子功能。
分組方法有兩種,一種是定性分組,一種是定量相關(guān)。
定性分組
根據(jù)感興趣的單個基因的度量值如表達(dá)值進(jìn)行分組,比如按照該基因表達(dá)中位數(shù)分組,該基因表達(dá)值高于中位數(shù)的樣品為一組,低于中位數(shù)的樣品為一組,構(gòu)建一個cls文件。如下,假如有8個樣品,其中4個樣品中該基因表達(dá)高 (samp1,?samp3,?samp7,?samp8),4個樣品中該基因表達(dá)低(samp 2 4 5 6),則cls文件如下 (一定注意樣本順序要一致):
8 2 1 #gene_high gene_low gene_high gene_high gene_high gene_high gene_low gene_low gene_low gene_low調(diào)整后的表達(dá)矩陣格式如下 (注意列的對應(yīng),high對高的樣品。)
Gene samp1 samp3 samp7 samp8 samp2 samp4 samp5 samp6 A 4 4 4 4 1 1 1 1 B . . . . . . . .C . . . . . . . .后續(xù)的操作就不說了,還是看生信寶典的一文掌握GSEA,超詳細(xì)教程,看完就都會了。
注:也可以按照該基因表達(dá)的第一和三四分位數(shù)分組,小于第一四分位數(shù)的為一組,大于第三四分位數(shù)的為另一組。
相關(guān)性排序
與前面把樣本分組不同,這里樣本不進(jìn)行分組了,而是把感興趣基因的表達(dá)做為樣本的一個屬性。在做GSEA分析時,其它基因按照與感興趣基因的表達(dá)相關(guān)性排序進(jìn)行后續(xù)分析。
這時應(yīng)該怎么準(zhǔn)備cls文件呢?
咱們先以一個時間序列樣本的cls文件為例:
-
#numeric為固定寫法,第一行,不需要修改
-
#Time名字隨便取,這里是時間序列,取名Time。#是必須的。
-
第3行是每個樣品的處理時間,0為0小時,1為1小時;每個時間3個重復(fù),所以寫了3遍;總共5個時間點,15個樣品。
回到我們這個例子,還是8個樣品,分別為samp 1 2 3 4 5 6 7 8,假如感興趣基因是A,表達(dá)矩陣如下:
Gene samp1 samp2 samp3 samp4 samp5 samp6 samp7 samp8 A 9 8 7 6 3 4 1 2 B . . . . . . . . C . . . . . . . .這時對應(yīng)的cls文件這么寫(注意一一對應(yīng)關(guān)系)。Aexpr隨便起的一個名字,代表A基因的表達(dá)。
#numeric #Aexpr 9 8 7 6 3 4 1 2然后導(dǎo)入GSEA就可以分析了。需要注意的是選擇合適的Ranking metric,如pearson相關(guān)性、Cosine、Manhattan?或Euclidean。
基于相關(guān)性的GSEA操作展示
直接看動畫,數(shù)據(jù)格式也有展示,GMT文件是自己整理的。這是1我們單細(xì)胞和群體轉(zhuǎn)錄組課程的一個小環(huán)節(jié) (回頭把這部分視頻拆出來放到騰訊課堂供訪問)。
公眾號看不了動畫,截圖兩張,點擊閱讀原文去查看吧。
討論學(xué)習(xí)是個很好的方式,歡迎大家有問題發(fā)到train@ehbio.com,信息全的,問題可重現(xiàn)的,或有意思的開放問題我們都會給予解決,寫個推文發(fā)出,既方便自己,又方便他人。
當(dāng)然如果類似轉(zhuǎn)錄組怎么分析,?宏基因組怎么分析,這樣大的問題還是參加我們的線下培訓(xùn)班或購買網(wǎng)課吧,都在www.ehbio.com/Training。
總結(jié)
以上是生活随笔為你收集整理的单基因GSEA怎么做?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 新冠患者样本单细胞测序文献汇总
- 下一篇: Seurat亮点之细胞周期评分和回归