R语言获取GEO表达数据
生活随笔
收集整理的這篇文章主要介紹了
R语言获取GEO表达数据
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
在磕鹽中一開始獲取GEO表達數據的方式主要是通過GEO數據庫下載數據,并且還要下載平臺信息,然后經過各種處理過程,比較麻煩。
后來一次無意中學習到了利用R語言快速獲取表達矩陣數據,十分方便。
這里以實驗GSE53408為例。
R語言代碼如下:
gse = getGEO("GSE53408",GSEMatrix = TRUE,destdir = ".",getGPL = T, AnnotGPL = T) #數據下載 exprs = exprs(gse[[1]])#表達量矩陣 fdata = fData(gse[[1]])#平臺信息 explan = data.frame(exprs)#轉置 explan$ID = fdata$ID#同步ID explan$symbol = fdata$ 'Gene symbol'#同步symbol#處理重復基因 rowMeans = apply(explan[,c(1:4)],1,function(x) mean(as.numeric(x), na.rm = T)) rowMeans_2 = data.frame(rowMeans) express = explan[order(rowMeans, decreasing = T),] express_2 = explan[!duplicated(express[, dim(express)[2]]),] explan_na = na.omit(express_2) explan_final = explan_na[explan_na$symbol != "",]#處理一個探針對應多個基因 explan_final$symbol =data.frame(sapply(explan_final$symbol,function(x) unlist(strsplit(x,'///'))[1]),stringsAsFactors = F)[,1]需要注意的是在使用上述代碼前需要先安裝R語言中的GEOquery程輯包,如果已安裝,這部分可忽略。
R語言代碼如下:
install.packages("BiocManager") BiocManager::install("GEOquery")#安裝 library(GEOquery)#導入運行結果如圖,其中explan_final即為最后得到的基因表達矩陣。
最后的結果如果需要可以保存到excel文件
R語言代碼如下:
install.packages("xlsx") library(xlsx)#導入 write.xlsx(explan_final,file = filepath)寫完啦~~~
總結
以上是生活随笔為你收集整理的R语言获取GEO表达数据的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: nginx报错汇总
- 下一篇: 如何将图像保存至计算机G7X,openc