OMIM数据库简介
歡迎關(guān)注"生信修煉手冊(cè)"!
OMIM 全稱叫做Online Mendelian Inheritance in Man, 是一個(gè)不斷更新的人類孟德爾遺傳病的數(shù)據(jù)庫。這個(gè)數(shù)據(jù)庫主要關(guān)注人類基因變異和表型性狀之間的關(guān)系。
網(wǎng)址如下:
https://omim.org/
數(shù)據(jù)庫中的每一條記錄,都會(huì)有一個(gè)唯一的由6位數(shù)字組成的OMIM 編號(hào),不同數(shù)字開頭的編號(hào)含義不同,其中:
數(shù)字1和2 開頭的,代表常染色體上的相關(guān)位點(diǎn)和表型(1995年之前創(chuàng)建的)
數(shù)字3開頭的,代表X染色體上的相關(guān)位點(diǎn)和表型
數(shù)字4開頭的,代表Y染色體上的相關(guān)位點(diǎn)和表型
數(shù)字5開頭的,代表線粒體上的相關(guān)位點(diǎn)和表型
數(shù)字6開頭的,代表常染色體上的相關(guān)位點(diǎn)和表型(1995 年之后創(chuàng)建的)
對(duì)于等位基因,每一條記錄都有一個(gè)唯一的MIM 編號(hào),由點(diǎn)號(hào)分隔的兩部分構(gòu)成,點(diǎn)號(hào)之前是突變位點(diǎn)對(duì)應(yīng)的OMIM 編號(hào),點(diǎn)號(hào)之后是一個(gè)由4位數(shù)字構(gòu)成的唯一ID, 用來記錄等位基因。
以IX 基因?yàn)槔?#xff0c;對(duì)應(yīng)的等位基因有 300746.0001 和 300746.0101 兩個(gè)MIM 編號(hào)。
這個(gè)數(shù)據(jù)庫是不斷更新的,截止到2018年5月29號(hào),數(shù)據(jù)庫中的數(shù)據(jù)記錄如下:
數(shù)據(jù)庫中的記錄,分成了5個(gè)類別。
1. Gene description
這種記錄以”*”開頭,主要記錄基因的相關(guān)信息,比如100640
2. Gene and phenotype, combined
這種記錄以+開頭,描述了基因和表型之間的關(guān)聯(lián),比如100650
在網(wǎng)頁上,會(huì)給出基因和表型之間的關(guān)聯(lián)
3. Phenotype description, molecular basis known
這種記錄以#開頭,描述了分子機(jī)制清楚的表型信息,比如100100
在Text字段中,會(huì)給出詳細(xì)的和該表型相關(guān)的基因突變信息
4. Phenotype description or locus, molecular basis unknown
這種記錄以%開頭,描述了分子機(jī)制不清楚的表型信息,通常都有由多種遺傳因素控制的疾病,相關(guān)突變位點(diǎn)較多,比如100070
5. Other
其他類型的記錄,這部分記錄之前沒有任何前綴,比如10050
目前該網(wǎng)站的完整數(shù)據(jù)只面向科研機(jī)構(gòu)開放下載,下載頁面的鏈接如下
https://omim.org/downloads/
其中的mim2gene.txt是大家都可以下載的,里面有數(shù)據(jù)庫所有記錄的編號(hào)。
第一列的ID就是omim編號(hào),知道編號(hào)之后,可以快速得到對(duì)應(yīng)的頁面,鏈接格式如下
https://omim.org/entry/100640
雖然不能下載到完整的數(shù)據(jù)庫,但是只需要根據(jù)編號(hào),也可以快速得到想要的信息。如果你編程能力夠強(qiáng),也可以抓取所有的網(wǎng)頁,構(gòu)建一個(gè)本地版的數(shù)據(jù)庫。
掃描關(guān)注微信號(hào),更多精彩內(nèi)容等著你!
總結(jié)
- 上一篇: 2020-08-26
- 下一篇: SQLsever数据库实例是啥子