日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

人类基因组在三大基因数据库中的不同版本

發布時間:2024/1/3 综合教程 45 生活家
生活随笔 收集整理的這篇文章主要介紹了 人类基因组在三大基因数据库中的不同版本 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

在數據分析中,經常需要下載物種的參考基因組序列,這時有很多數據庫可以選擇,比如NCBI, Ensembl, UCSC這三個通用的數據庫,或者該物種特有的數據庫,

比如模式生物擬南芥等有專門的數據庫。

在NCBI, Ensembl 和 UCSC中對于同一個物種,編號不統一,在這里整理一下它們之間的關系,以人類基因組為例:

在NCBI中,對于不同的拼裝版本,以NCBI Build Number 進行區分,而相同的版本之間又有微小的區別,以Version 表示不同的小版本,

在下面的連接中可以看到人類基因組之前的版本,

比如BUILD.36.1, NCBI Build Number 為36, Version 為1, 從BUILD 37.1 開始,又有了新的命名方式,GRCh37

有個CRC的組織(http://www.ncbi.nlm.nih.gov/projects/genome/assembly/grc/),該組織是由EBI,NCBI等組織聯合起來的學術團體,對基因組的不同拼裝版本進行簡短而統一的命名,h表示人類,37

表示版本號,對于同一個版本,會有小的修改,此時用p加上編號進行標識,比如Build 37.3 又命名為GRCh37.p5 ,p代表patch, 補丁;

目前比較常用的版本有GRCh37 和CRCh38 兩個版本;

在Ensembl 中,有不同的release ,比如

人類基因組從release-76到release-83對應 GRCh38, 從release-55到release-75對應GRCh37

這個從命名方式可以看出來,以release-83為例:

人類基因組第一條染色體命名為 Homo_sapiens.GRCh38.dna.chromosome.1.fa.gz,其中的CRCh38就表示拼裝的版本

在UCSC中,

hg38對應GRCh38

hg19對應GRCh37

還有一點需要注意的是, Ensembl下載下來的fasta序列, 其標識符中不包含chr,

比如人類基因組1號染色體,在UCSC和NCBI中下載下來的標識符為>chr1,而Ensembl 中為>1

總結

以上是生活随笔為你收集整理的人类基因组在三大基因数据库中的不同版本的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。