當前位置:
首頁 >
基于Salmon的转录组批量定量流程和差异分析
發布時間:2025/3/15
80
豆豆
生活随笔
收集整理的這篇文章主要介紹了
基于Salmon的转录组批量定量流程和差异分析
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
繼續前文:基于Salmon的轉錄組定量流程
循環定量多個樣品的表達量
整理樣本信息表,命名為sampleFile,內容如下:
Samp conditions individual untrt_N61311 untrt N61311 untrt_N052611 untrt N052611 untrt_N080611 untrt N080611 untrt_N061011 untrt N061011 trt_N61311 trt N61311 trt_N052611 trt N052611 trt_N080611 trt N080611 trt_N061011 trt N061011采用for循環進行批量定量 (參考這個為生信學習打造的開源Bash教程真香!!,理解更多):
for samp in `tail -n +2 sampleFile | cut -f 1`; do salmon quant --gcBias -l A -1 ${samp}_1.fq.gz -2 ${samp}_2.fq.gz -i genome/GRCh38.salmon_sa_index -o ${samp}/${samp}.salmon.count -p 4 >${samp}.salmon.log 2>&1; done &整理Salmon定量文件用于DESeq2差異基因鑒定
找到Salmon的輸出文件并壓縮起來,用于下載到本地進行差異分析。
# 列出salmon的輸出文件 find . -name quant.sf # 這個壓縮包下載解壓到本地 zip quant.sf.zip `find . -name quant.sf`./trt_N080611/trt_N080611.salmon.count/quant.sf
./trt_N061011/trt_N061011.salmon.count/quant.sf
./untrt_N61311/untrt_N61311.salmon.count/quant.sf
生成輔助文件,指出每個樣品對應的自己的quant.sf文件,便于導入tximport包。
# 生成一個兩列文件方便R導入 # xargs接收上一步的輸出,按批次提供給下游程序作為輸入 # -i: 用{}表示傳遞的值 cut -f 1 sampleFile | xargs -i echo -e "{}\t{}/{}.salmon.count/quant.sf" >salmon.output head salmon.output兩列文件
# Samp Samp/Samp.salmon.count/quant.sf # untrt_N61311 untrt_N61311/untrt_N61311.salmon.count/quant.sf # untrt_N052611 untrt_N052611/untrt_N052611.salmon.count/quant.sf獲得基因和轉錄本的對應關系,獲取基因的表達量
# 如果沒有GTF文件,可以用其他文件,只需獲取轉錄本和基因名字對應關系就可以 # 如果不知道對應關系,也可以把每個轉錄本當做一個基因進行分析 # Trinity拼裝時會生成這個文件 # 注意修改$14, $10為對應的信息列, # tx2gene為一個兩列文件,第一列是轉錄本沒名字,第二列是基因名字。 sed 's/"/\t/g' genome/GRCh38.gtf | awk 'BEGIN{OFS=FS="\t"}{if(FNR==1) print "TXname\tGene"; if($3=="transcript") print $14, $10}' >GRCh38.tx2gene head GRCh38.tx2gene轉錄本->基因
# TXname Gene # ENST00000608838 ENSG00000178591 # ENST00000382410 ENSG00000178591 # ENST00000382398 ENSG00000125788 # ENST00000542572 ENSG00000125788至此就完成了基于Salmon的所有樣本基因和轉錄本的定量。然后下載sampleFile、GRCh38.tx2gene、salmon.output、quant.sf.zip文件到本地進行下游分析。
具體差異基因鑒定可參考高通量數據中批次效應的鑒定和處理 - 系列總結和更新。
往期精品(點擊圖片直達文字對應教程)
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
?
(請備注姓名-學校/企業-職務等)
總結
以上是生活随笔為你收集整理的基于Salmon的转录组批量定量流程和差异分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 高颜值免费在线绘图工具新增WGCNA和差
- 下一篇: 一图感受各种机器学习算法