寻找影响免疫浸润细胞的基因(一)
生活随笔
收集整理的這篇文章主要介紹了
寻找影响免疫浸润细胞的基因(一)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
??目錄
前言
一、immunedeconv包的安裝
二、數據的前期處理
1.基因ID的轉換以及數據格式的處理
2.數據的前期處理
3.計算免疫浸潤程度
總結
前言
目前已經有許多的算法可以根據RNA-seq計算免疫細胞的浸潤,其中代表性的R包是immunedeconv。接下來這個系列文章將根據通過這個包計算RNA-seq數據中的免疫浸潤程度,并通過這個數據計算影響免疫浸潤的相關基因。
一、immunedeconv包的安裝
immunedeconv不太好安裝,建議使用從github下載源代碼進行本地安裝。
首先,下載Code包:
進入immunedeconv 作者的主頁:
GitHub - icbi-lab/immunedeconv: A unified interface to immune deconvolution methods (CIBERSORT, EPIC, quanTIseq, TIMER, xCell, MCPcounter)
然后,安裝該代碼:
install.packages("devtools")##這是安裝用的工具包 devtools::install_local("/文件/immunedeconv-master.zip")二、數據的前期處理
1.基因ID的轉換以及數據格式的處理
代碼如下:
# 讀入表達數據 exprMatrix <- read.table("/Project/the correlation for Immune cell infiltration with tumor/TCGA TIL analysis/Normalized_LUAD.xls",header=TRUE, as.is=TRUE) ##如果不需要轉換基因名和ID,則直接跳到最下面 library(stringr) exprMatrix$gene <- str_split(exprMatrix$gene,'[.]',simplify = T)[,1]##按照某符號拆分某列 which(duplicated(exprMatrix$gene)) colnames(exprMatrix)[1] <- 'gene' exprMatrix <- subset(exprMatrix,gene!="NA") colnames(exprMatrix)[1] <- 'ENSEMBL'ID_gene_name <- read.csv('/所有教程/常用文件/length_gene_ID.csv',row.names = 1) library(data.table) length_gene <- ID_gene_name[,-1] keys <- colnames(length_gene)[!grepl('V1',colnames(length_gene))] length_gene <- as.data.table(length_gene) length_gene <- length_gene[,list(length= mean(V1)),keys] exprMatrix <- merge(ID_gene_name,exprMatrix,by = 'ENSEMBL', all = F)##不需要轉換的直接跳轉到這里 exprMatrix <- cbind(exprMatrix[1],exprMatrix[1],exprMatrix) write.csv(exprMatrix,'exprMatrix.csv')2.數據的前期處理
這一步主要是清除一些空基因和無效基因,代碼如下:
exprMatrix <- read.csv('/Project/the correlation for Immune cell infiltration with tumor/TCGA TIL analysis/analysis_flow/ID_name_transport/exprMatrix.csv',row.names = 1) ##讀入處理好的文件 mean <- apply(exprMatrix[,4:ncol(exprMatrix)],1,mean) ##計算每個基因的均值 exprMatrix <- exprMatrix[-which(mean == 0),] ##去除均值等于0的基因 exprMatrix <- exprMatrix[-which(duplicated(exprMatrix$Gene.name)),] ##去除基因名重復的基因 exprMatrix <- exprMatrix[,c(-1,-3)] ##去除多余的第一列和第三列 rownames(exprMatrix) <- exprMatrix$Gene.name ##把第一列作為行名 exprMatrix <- exprMatrix[,-1] ##去除第一列3.計算免疫浸潤程度
利用immunedeconv包計算RNA-seq的免疫浸潤程度,代碼如下:
#評估免疫浸潤 library(immunedeconv) res <- deconvolute(exprMatrix, method="quantiseq") ##method可以更改,支持多種方法,詳見immunedeconv包的介紹 res <- as.data.frame(res,row.names = 1) ##講結果文件轉換為data.frame rownames(res) <- res[,1] ##把第一列設為行名 res <- res[,-1] immune <- rbind(res,exprMatrix) ##將免疫浸潤結果和RNA-seq數據合并 write.csv(immune, 'immune.csv')總結
這一部分主要是介紹了免疫浸潤的計算,下一節將會介紹如何計算相關基因。
總結
以上是生活随笔為你收集整理的寻找影响免疫浸润细胞的基因(一)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ANSI SQL标准和准则
- 下一篇: OpenMP中的常用函数