R语言获取GEO表达数据
生活随笔
收集整理的這篇文章主要介紹了
R语言获取GEO表达数据
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
在磕鹽中一開(kāi)始獲取GEO表達(dá)數(shù)據(jù)的方式主要是通過(guò)GEO數(shù)據(jù)庫(kù)下載數(shù)據(jù),并且還要下載平臺(tái)信息,然后經(jīng)過(guò)各種處理過(guò)程,比較麻煩。
后來(lái)一次無(wú)意中學(xué)習(xí)到了利用R語(yǔ)言快速獲取表達(dá)矩陣數(shù)據(jù),十分方便。
這里以實(shí)驗(yàn)GSE53408為例。
R語(yǔ)言代碼如下:
gse = getGEO("GSE53408",GSEMatrix = TRUE,destdir = ".",getGPL = T, AnnotGPL = T) #數(shù)據(jù)下載 exprs = exprs(gse[[1]])#表達(dá)量矩陣 fdata = fData(gse[[1]])#平臺(tái)信息 explan = data.frame(exprs)#轉(zhuǎn)置 explan$ID = fdata$ID#同步ID explan$symbol = fdata$ 'Gene symbol'#同步symbol#處理重復(fù)基因 rowMeans = apply(explan[,c(1:4)],1,function(x) mean(as.numeric(x), na.rm = T)) rowMeans_2 = data.frame(rowMeans) express = explan[order(rowMeans, decreasing = T),] express_2 = explan[!duplicated(express[, dim(express)[2]]),] explan_na = na.omit(express_2) explan_final = explan_na[explan_na$symbol != "",]#處理一個(gè)探針對(duì)應(yīng)多個(gè)基因 explan_final$symbol =data.frame(sapply(explan_final$symbol,function(x) unlist(strsplit(x,'///'))[1]),stringsAsFactors = F)[,1]需要注意的是在使用上述代碼前需要先安裝R語(yǔ)言中的GEOquery程輯包,如果已安裝,這部分可忽略。
R語(yǔ)言代碼如下:
install.packages("BiocManager") BiocManager::install("GEOquery")#安裝 library(GEOquery)#導(dǎo)入運(yùn)行結(jié)果如圖,其中explan_final即為最后得到的基因表達(dá)矩陣。
最后的結(jié)果如果需要可以保存到excel文件
R語(yǔ)言代碼如下:
install.packages("xlsx") library(xlsx)#導(dǎo)入 write.xlsx(explan_final,file = filepath)寫完啦~~~
總結(jié)
以上是生活随笔為你收集整理的R语言获取GEO表达数据的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: nginx报错汇总
- 下一篇: 如何将图像保存至计算机G7X,openc