NCBI SRA数据预处理
SRA數據的的處理流程大概如下
一、SRA數據下載、
NCBI 上存儲的數據現在大都存儲為SRA格式。
下載以后就是以SRA為后綴名。
這里可以通過三種方式下載SRA格式的數據。
1.通過http方式,2.通過ftp方式,3.通過Aspera
Aspera可以在NCBI網站上下載。
參閱:http://www.ncbi.nlm.nih.gov/books/NBK47540/
?
二、SRA格式轉換成FASTQ格式
./fastq-dump -A SRR058977 ~/project/yanzi/data/GEO/SRA/SRR058977.sra
fastq-dump可以在ncbi官方網站下載,這里面包含一系列的轉換工具;
參閱:http://www.ncbi.nlm.nih.gov/books/NBK56560/
http://eutils.ncbi.nih.gov/Traces/sra/?view=software
轉換成FASTQ,SFF,lllumina native,AB SOLiD native等格式;
?
另,轉換FASTQ以后要轉換成FASTA 命令如下:
awk '{if(FNR%4==1) print ">",$0; else if(FNR%4==2) print $0;}' a.fastq >a.fasta
?
————————----------------------------------------------------------------
以上部分為預處理部分:
當然我做的方向是比對方向,就可以用fasta做比對工作了。
………………………………………………………………………………………………………………………………………………………………………………………………
后面還可以做其他反面的研究:
?
3.去接頭(此步要注意是否有接頭,一般RNA-SEQ數據應該是沒有接頭的)
4.用tophat尋找可變剪切
tophat -r 42 -G genome.fa -o PF genomeIndex SRR058977.fastq
5.用cufflinks找不同組織中的差異
cuffdiff genomeAnnotation.gff ? ../BF/accept.bam ./accept.bam
來源:http://blog.sciencenet.cn/blog-565558-626137.html
…………………………………………………………………………………………………………………………………………………………
?
可能會用到的修改目錄權限的linux命令
?
Linux改變分區權限(簡單好用版)
?
原理:
1.在Linux和Unix世界里,一切都是以文件的形式存在的。文件夾是文件,文件是文件,設備也是文件。
2.分區在掛載后,會在 /media/ 下以文件夾的形式顯現
3.chmod用于修改權限 而chmod ugo+rwx 用于給所有的用戶和用戶組添加所有的權限
步驟:
1.假設需要修改權限的分區名為x
2.掛載x
3.賦權
代碼:
sudo chmod ugo+rwx /media/x
?
?
?
?
轉載于:https://www.cnblogs.com/suncoolcat/p/3283656.html
總結
以上是生活随笔為你收集整理的NCBI SRA数据预处理的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: hdu 4409 Family Name
- 下一篇: Linux 学习 Ubuntu 12.0