日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 >

NCBI SRA数据库使用详解

發(fā)布時間:2025/7/25 62 豆豆
生活随笔 收集整理的這篇文章主要介紹了 NCBI SRA数据库使用详解 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

?

轉(zhuǎn):https://shengxin.ren/article/16

https://www.cnblogs.com/lmt921108/p/7442699.html

批量下載SRA http://www.360doc.com/content/18/0428/15/48272598_749456477.shtml

?我的下載的數(shù)據(jù)在/home/username/ncbi/public/sra

SRA(Sequence ReadArchive)數(shù)據(jù)庫是用于存儲二代測序的原始數(shù)據(jù),包括 454,Illumina,SOLiD,IonTorrent,Helicos 和 CompleteGenomics。除了原始序列數(shù)據(jù)外,SRA現(xiàn)在也存在raw reads在參考基因的比對信息。

根據(jù)SRA數(shù)據(jù)產(chǎn)生的特點,將SRA數(shù)據(jù)分為四類:

  • Studies-- 研究課題

  • Experiments-- 實驗設(shè)計

  • Runs-- 測序結(jié)果集

  • Samples-- 樣品信息

SRA中數(shù)據(jù)結(jié)構(gòu)的層次關(guān)系為:Studies->Experiments->Samples->Runs.

  • Studies是就實驗?zāi)繕?biāo)而言的,一個study 可能包含多個Experiment。

  • Experiments包含了Sample、DNA source、測序平臺、數(shù)據(jù)處理等信息。

  • 一個Experiment可能包含一個或多個runs。

  • Runs 表示測序儀運行所產(chǎn)生的reads。

SRA數(shù)據(jù)庫用不同的前綴加以區(qū)分:

    • ERP或SRP表示Studies;

    • SRS 表示 Samples;

    • SRX 表示 Experiments;

    • SRR 表示 Runs;

使用:

  搜索相關(guān)研究的疾病,選擇相應(yīng)數(shù)據(jù)集

點擊第一個案例進入詳細信息界面?

Study詳細信息頁面

Experiments詳細信息頁面

Runs詳細信息頁面,選擇要下載的Runs

3、下載數(shù)據(jù)

要下載SRA數(shù)據(jù),我們需要先安裝SRA Toolkit軟件包,下載地址:

https://www.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software

根據(jù)自己的環(huán)境下載相應(yīng)的軟件包。

主要包括:

  • CentOS 32/64

  • Ubuntu 32/64

  • MacOS 32/64

  • MS Windows 32/64

以CentOS為例:

1、下載安裝:

wget "http://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-centos_linux64.tar.gz"

tar xzf sratoolkit.current-centos_linux64.tar.gz

2、運行下載

cd sratoolkit.2.5.7-centos_linux64/bin

./prefetch SRR2172038

下載完成后,會在你的工作主目錄下生成一個ncbi的文件夾。

cd ncbi/public/sra

查看SRR2172038.sra數(shù)據(jù)

?

3、轉(zhuǎn)換fastq

?

/sratoolkit.2.5.7-centos_linux64/bin/fastq-dump ./SRR2172038.sra

?

4、轉(zhuǎn)換fasta

?

/sratoolkit.2.5.7-centos_linux64/bin/fastq-dump ?--fasta?./SRR2172038.sra

?

批量下載SRA數(shù)據(jù)

?

1.新建文件,命令為prefetch_bash.sh ? (感覺命名簡單粗暴啊)

?

vi prefetch_bash.sh

?

#!/bin/bash

?

for id in ?$(seq 1 5) ? ?#記住該語法

?

do

?

  prefetch SRR35899${id}

?

done

?

3.給文件一個可執(zhí)行權(quán)限

?

chmod +755 frefetch_bash.sh

?

4.添加環(huán)境變量或者將其move到/usr/bin即可

?

添加環(huán)境變量:

?

vi ~/.profile

?

export PATH=/home/lmt/biosoft/data:$PATH

?

保存之后需source .profile

?

?

5.利用prefetch_bash.sh批量下載所需的SRR文件

?

在終端輸入:prefetch_bash.sh

下載的SRR數(shù)據(jù)默認(rèn)存放在:/home/lmt/ncbi/public/sra里

?

?

轉(zhuǎn)載于:https://www.cnblogs.com/lyyao/p/9526314.html

總結(jié)

以上是生活随笔為你收集整理的NCBI SRA数据库使用详解的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。