单基因gsea_这篇3+分核心基因筛选,点个在看,我们复现这篇文章!
今天和大家分享的是2019年11月發表在Frontiers in Genetics(IF:3.517)上的一篇文章,“Identifying Key Genes and Functionally Enriched Pathways in Sj?gren’s Syndrome by Weighted Gene Co-Expression Network Analysis”,作者使用GEO數據庫中的干燥綜合征(SS)數據集進行DEGs篩選,對DEGs進行WGCNA分析鑒定出與SS相關的共表達模塊以及核心基因,并且進行了GO富集分析與GSEA分析。
Identifying Key Genes and Functionally Enriched Pathways in Sj?gren’s Syndrome by Weighted Gene Co-Expression Network Analysis
通過加權基因共表達網絡分析鑒定干燥綜合征的核心基因與功能通路富集
一、研究背景
干燥綜合征(SS)是一個主要累及外分泌腺體的慢性炎癥性自身免疫病,以口干和眼睛干燥為主要癥狀,并可伴有多器官系統性表現。目前SS的病因與確切分子機制尚不明確,一些miRNA可以作為SS的診斷標志物,作者希望通過較大樣本的WGCNA分析識別SS相關的基因網絡特征,確定具有診斷意義的核心基因。
二、分析流程
三、結果解讀
1.篩選SS組和正常對照組的差異表達基因
GSE51092中的mRNA表達譜數據集包含190例SS患者和32例健康對照組外周血樣本,使用limma包進行差異表達基因分析,以SAM篩選|log2FC| ≥1和FDR <0.05的DEGs,結果選出1,483個DEGs,表1展示了差異表達最明顯的20個上調基因和10個下調基因。
表1:SS和對照樣本中的30個DEGs2.WGCNA分析樣本中基因共表達網絡
確定合適的soft-thresholding power(軟閥值)建立臨近矩陣以使基因分布符合無標度網絡特征,圖A中對1到20的軟閥值進行了網絡拓撲分析,左圖縱坐標為無標度拓撲擬合指數,以0.9作為閾值,右圖為平均連接度,結果確定8作為軟閥值。
對基因進行聚類分析,對聚類樹以動態剪切法最終得到17個共表達模塊(圖B),其中藍綠色模塊中包含的基因最多,其次是黑色、藍色和黃色。
圖C中拓撲重疊熱圖顯示上述模塊之間的高度獨立性。
3.模塊-特征相關性分析和hub基因鑒定
模塊-特征相關性熱圖(圖A)和各模塊的基因顯著性值(圖B)顯示多個模塊與SS相關,其中藍綠色模塊與SS相關性最高。圖C顯示藍綠色模塊中 module membership(MM)與基因顯著性之間的相關性,以基因顯著性>0.4且MM較高(加權相關指數>0.9)為標準,將前19個基因確定為hub基因,圖D中展示了這19個基因的拓撲重疊熱圖,顯示出基因之間的高正相關。
圖2:模塊-特征相關性分析和hub基因鑒定4.核心共表達模塊的功能注釋
作者對藍綠色模塊中的基因進行了GO富集分析,結果顯示基因主要富集在對病毒的反應、免疫反應、防御反應、對細胞因子刺激的反應、炎癥反應等生物過程(圖A)。Circos圖對基因與GO terms的關系進行交叉驗證,顯示其中大量與免疫反應相關的基因也同時富集在其他生物過程中,表明這些基因可能與協調SS發展的多種生物途徑有關。
圖3:GO富集分析5.hub基因的驗證與功效評估
作者對WGCNA鑒定的hub基因中沒有SS相關研究的5個基因進行了表達差異的驗證與功效評估:EIF2AK2 (A),GBP1 (B),PARP12 (C),TDRD7 (D),PARP14 (E)。圖4為原數據集,圖5圖6中作者使用GSE84844(30例SS患者與30例對照組外周血單核細胞的表達譜數據)和GSE66795(131例SS患者與30例健康對照組外周血表達譜數據)兩數據集進行驗證。結果顯示以上5個基因表達量在SS患者中均顯著上調(P < 0.001)。
圖4:GSE51092數據集中5個hub基因的表達差異分析圖5:GSE84844數據集中5個hub基因的表達差異分析圖6:GSE66795數據集中5個hub基因的表達差異分析圖7中作者以ROC曲線評估了5個基因的診斷價值,結果顯示在3個數據集中5個基因的AUC值均大于0.7,表現出較高的診斷價值。
圖7:3個數據集中5個hub基因的ROC曲線6.hub基因的單基因GSEA分析
作者分別以5個hub基因的表達量中值將樣本分為兩組進行GSEA分析,以MSigDB中的h.all.v6.2.sytmbols.gmt作為參考基因集。圖8展示了5個hub基因分組中差異表達基因的富集結果氣泡圖,作者從中選出與免疫相關的基因集進行進一步分析。
結果顯示EIF2AK2(圖9A)和TDRD7(圖9E)高表達組中“inflammatory response”、 “interferon α response”和 “interferon γ response三個基因集顯著富集。GBP1高表達組中“Regulation of the immune response”、“Regulation of the defense response” 和 “response to cytokine”三個基因集顯著富集(圖9B)。PARP12(圖9C)和PARP14(圖9D)高表達組中“inflammatory response” 和 “interferon α response”兩個基因集顯著富集。
小結
? 這篇文章中作者主要是對SS數據集進行WGCNA分析構建基因網絡,鑒定出與SS相關的模塊和核心基因后對其進行了功能通路富集和診斷價值評估。作者首先篩選出數據集樣本的DEGs,然后使用WGCNA將基因分為不同的模塊,并進行了模塊-特征相關性分析,在與SS相關性最高的藍綠色模塊中鑒定出核心基因。進一步對藍綠色模塊中的基因進行GO富集分析,并使用其他兩個數據集驗證了核心基因的差異表達和診斷價值,最后對核心基因進行了單基因的GSEA分析。功能富集結果均顯示在病毒反應、防御反應、對細胞因子刺激以及干擾素的反應等多個免疫相關通路中顯著富集。
還是和以前一樣,后臺回復[9f]即可獲得今天小編和大家分享的文章。我們下期再見!
科研菌學術討論群,在群內可以用自己的昵稱,廣告一律踢;其他公眾號的宣傳也不發,就算是要發,提前和小編商量和確認,不然也是一律踢哈。
歡迎添加小編微信↑↑↑
請大家加我的時候就備注好“學術討論群”以及自己的“單位+專業+姓名”。
編輯:凍鴛鴦
校審:糯米飯
總結
以上是生活随笔為你收集整理的单基因gsea_这篇3+分核心基因筛选,点个在看,我们复现这篇文章!的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SpringBoot测试时出现White
- 下一篇: resources下的resources