mysql的seq2_DESeq2处理TCGA数据库Seq-count数据
1、DESeq2需要導入兩個數據集:mycounts, colData。先說mycounts,這就是處理完的TCGA數據RNAmatrix.txt,直接讀入即可。
library(tidyverse)
library(DESeq2)
#導入數據
setwd("E:/2.Hitseq_counts/")
mycounts
head(mycounts)
#這里有個x,需要去除,先把第一列當作行名來處理
rownames(mycounts)
#把帶X的列刪除
mycounts
head(mycounts)
2、colData就是對每個樣本的一個情況說明。這個可以生成,也可以自己寫一個保存為csv格式。我一般自己寫。
#載入colData文件
colData
head(colData)
3、構建矩陣
#構建數據矩陣
dds
dds
#查看dds的內容
dds
#接下來,我們要查看treat VS control的總體結果,并根據p-value進行重新排序。利用summary命令統計顯示一共多少個genes上調和下調(FDR0.1)
res = results(dds, contrast=c("condition", "control", "treat")) ##或者res= results(dds)
res = res[order(res$pvalue),]
head(res)
summary(res)
4、輸出結果
#所有結果先進行輸出
write.csv(res,file="All_results.csv")
table(res$padj<0.05)
#獲取padj(p值經過多重校驗校正后的值)小于0.05,表達倍數取以2為對數后大于1或者小于-1的差異表達基因。代碼如下
diff_gene_deseq2 1.5) ##或者diff_gene_deseq2 1 | log2FoldChange < -1))
dim(diff_gene_deseq2)
head(diff_gene_deseq2)
write.csv(diff_gene_deseq2,file= "DEG_treat_vs_control.csv")
總結
以上是生活随笔為你收集整理的mysql的seq2_DESeq2处理TCGA数据库Seq-count数据的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 串口通讯基础及S3C2410 UART控
- 下一篇: erpnext mysql_window