数据库 | OMIM (在线人类孟德尔遗传)数据库简介
? OMIM,即在線人類孟德爾遺傳(Online Mendelian Inheritance in Man),是一個(gè)綜合的、權(quán)威的研究人類表型和基因型關(guān)系的數(shù)據(jù)庫(kù),收錄了所有已知的孟德爾疾病,和超過16000個(gè)基因的信息(涵蓋一大半人類已知的基因)。
? OMIM并不是創(chuàng)造了這些數(shù)據(jù),而是對(duì)已發(fā)表的研究結(jié)果的非常系統(tǒng)的整理與整合,并每日更新、免費(fèi)獲取。OMIM中的一個(gè)常見的疾病的頁(yè)面,其內(nèi)容類似一篇綜述,包含:表型與基因的關(guān)系、臨床簡(jiǎn)介、疾病基本信息與描述、臨床特征、診斷、臨床管理、發(fā)病機(jī)制、分子遺傳、群體遺傳、動(dòng)物模型、背景歷史、研究進(jìn)展和參考文獻(xiàn)。
? 網(wǎng)站條目 (Entries)也包含了大量其他遺傳資源 (數(shù)據(jù)庫(kù))的鏈接,可供與遺傳疾病有關(guān)的醫(yī)生、專業(yè)人員、遺傳學(xué)研究人員、相關(guān)學(xué)科和醫(yī)學(xué)的高年級(jí)學(xué)生使用。
? OMIM的發(fā)展歷史悠久,最早由維克多·A·麥考斯克 (Victor A. McKusick)博士在20世紀(jì)60年代早期創(chuàng)建,作為孟德爾性狀和疾病 (Mendelian traits and disorders)的目錄,命名為人類孟德爾遺傳 (Mendelian Inheritance in Man,MIM)。
? 在1966年到1998年間,MIM出版了12個(gè)版本。在線版的OMIM是1985年由美國(guó)國(guó)家醫(yī)學(xué)圖書館 (National Library of Medicine)和約翰·霍普金斯大學(xué) (Johns Hopkins)威廉·H·韋爾奇醫(yī)學(xué)圖書館 (William H. Welch Medical Library)合作創(chuàng)建的。從1987年開始在互聯(lián)網(wǎng)上廣泛使用。1995年,美國(guó)國(guó)家生物技術(shù)信息中心 (NCBI)參與了OMIM的萬維網(wǎng)開發(fā)。
? 麥考斯克博士是繪制人類基因組圖譜的早期倡導(dǎo)者,并密切參與了人類基因組計(jì)劃的早期,并擔(dān)任了人類基因組組織 (HUGO)的創(chuàng)始主席。1997年,為了表彰他一生的貢獻(xiàn),他獲得了拉斯克醫(yī)學(xué)科學(xué)特殊成就獎(jiǎng)。
https://omim.org/about
以鐮刀型貧血癥為例介紹OMIM的使用
以一個(gè)比較熟知的鐮刀型貧血癥(Sickle Cell Anemia,SCA)為例。之前一篇推文介紹過SCA的致病機(jī)制、突變蛋白三維結(jié)構(gòu),見:正常與突變蛋白三維結(jié)構(gòu)模型的繪制與分析。
SCA的致病基因?yàn)镠BB(Hemoglobin Subunit Beta,血紅蛋白β亞基)基因,第6位氨基酸Glu轉(zhuǎn)位為Val(Glu6Val)。野生與突變蛋白三維結(jié)構(gòu)模型如下(詳見推文):
??
表面電荷:左側(cè)野生,右側(cè)突變
野生來自AlphaFold,突變來自PyMOL的手動(dòng)突變。
??
表面電荷:左側(cè)野生,右側(cè)突變
野生和突變模型均使用SWISS-MODEL從頭預(yù)測(cè)。
致病機(jī)制圖解:
OMIM疾病頁(yè)面的頭部信息
進(jìn)入OMIM主頁(yè)(https://omim.org/)。在OMIM的檢索框中輸入:Sickle Cell Anemia。
OMIM的檢索框中可輸入:臨床特征、表型、基因等關(guān)鍵字進(jìn)行檢索。
若要下載重要的后臺(tái)數(shù)據(jù),以便批量分析,需要注冊(cè)學(xué)校或研究單位的正式郵箱(而非商業(yè)郵箱)。
檢索結(jié)果如下圖:
進(jìn)入第一個(gè)檢索結(jié)果,頁(yè)面如下圖:
紅框:目錄。點(diǎn)擊之后在頁(yè)面內(nèi)快速跳轉(zhuǎn)。包括:表型與基因的關(guān)系、臨床簡(jiǎn)介、疾病基本信息與描述、臨床特征、診斷、臨床管理、發(fā)病機(jī)制、分子遺傳、群體遺傳、動(dòng)物模型、背景歷史、研究進(jìn)展和參考文獻(xiàn)。
綠框:是外部鏈接。Protein給出了SCA致病基因HBB蛋白的UniProt鏈接。另有其它臨床資源數(shù)據(jù)庫(kù)、動(dòng)物模型、細(xì)胞系鏈接。
藍(lán)框:疾病和基因關(guān)系簡(jiǎn)述。SCA的MIM編號(hào)'# 603903'中的#號(hào)表示描述性條目,通常指表型。
井號(hào)(#)表示描述性條目,通常是表型的;星號(hào)(*)表示一個(gè)基因;加號(hào)(+)表示該條目包含已知序列和表型的基因描述;百分號(hào)(%)表示該條目描述了一個(gè)確定的孟德爾表型或未知分子基礎(chǔ)的表型位點(diǎn);插入符號(hào)(^)表示該條目不再存在。
黃框:表示表型與基因的關(guān)系。
?1-7分別表示:?
??1. 染色體高分辨率顯帶及命名體系。'11p15.4'表示11號(hào)染色體短臂1區(qū)5帶第4亞帶。
??2.?表型(Phenotype),或叫顯型,可指某種疾病。
表型:有特定基因型的個(gè)體,在一定環(huán)境條件下,生物體所表現(xiàn)出來的一組可觀察到的特征(characteristics)或性狀(traits)的總和。性狀(traits)指生物形態(tài)、結(jié)構(gòu)和生理、生化等特性。
??3. 表型的MIM編號(hào)。是OMIM的一種編號(hào)系統(tǒng)(或條目,entry),6位數(shù)字。編號(hào)原則如下:
鐮刀型貧血癥的Phenotype MIM number為?'#?603903',說明是1994年之后被OMIM收錄并編號(hào)的常染色體疾病。
?4.?經(jīng)典孟德爾遺傳模式。包括:常染色體隱性遺傳,Autosomal Recessive (AR);常染色體顯性遺傳,Autosomal Dominant (AD);X連鎖隱性遺傳,X-linked recessive (XR);X連鎖顯性遺傳,X-linked?dominant (XD);Y連鎖遺傳,Y-linked inheritance。
? 5. 表型映射關(guān)鍵詞。可將鼠標(biāo)移動(dòng)到數(shù)字上以顯示相關(guān)信息。
相關(guān)數(shù)字的含義:1表示該疾病是通過野生型基因定位的;2表示疾病表型本身被定位;3表示疾病的分子基礎(chǔ)是已知的;4表示該疾病是一種染色體缺失或復(fù)制綜合征。
??6.?相關(guān)的基因或染色體位點(diǎn)或位置。
? 7. 基因的MIM編碼。OMIM的MIM編碼不僅針對(duì)表型,也涵蓋基因,以及該基因的等位基因變異(SNV/SNP)。
一個(gè)疾病的、一個(gè)致病基因的多個(gè)不同的SNV/SNP(單核苷酸變異/等位基因變異),用MIM編號(hào)的后面跟著的一個(gè)小數(shù)點(diǎn)和一個(gè)唯一的4位數(shù)字來表示。
例如,Factor IX基因(即F9基因,血友病的一個(gè)致病基因)的MIM編號(hào)為300746,它的多個(gè)等位變異編號(hào)為300746.0001到300746.0101,可分別對(duì)應(yīng)不同的SNV。
下圖是HBB基因等位基因變異(SNV)的MIM編號(hào)(https://omim.org/entry/141900):
點(diǎn)擊目錄中的Table?View:
疾病與基因詳情頁(yè)的其它信息
疾病的詳情頁(yè)。主要是對(duì)該疾病已有研究結(jié)果、臨床經(jīng)驗(yàn)的詳細(xì)匯總,具體包括:臨床特征、診斷、臨床管理、發(fā)病機(jī)制、分子遺傳、群體遺傳、動(dòng)物模型、背景歷史、研究進(jìn)展和參考文獻(xiàn)。
基因的詳情頁(yè),如HBB(MIM編號(hào):* 141900。https://omim.org/entry/141900),展示方式與疾病詳情頁(yè)不同,主要包括:所有與該基因有關(guān)的疾病(見下圖)、基因結(jié)構(gòu)、基因組映射(Mapping)、基因功能、生化特性、分子遺傳學(xué)、動(dòng)物模型、背景歷史、等位基因變異(這部分的具體內(nèi)容見上文)。
可見HBB不僅僅與SCA有關(guān)(AR),也與地中海貧血等疾病相關(guān)(AD),且同一個(gè)基因在不同疾病的中的遺傳模式可能不同。
OMIM后臺(tái)數(shù)據(jù)的下載。在Download頁(yè)面?提供一些文件的下載鏈接。一般需要寫郵件申請(qǐng),但某些商業(yè)郵箱如網(wǎng)易或qq郵箱可能無法申請(qǐng)。此外,數(shù)據(jù)不完全免費(fèi),有些數(shù)據(jù)對(duì)方可能會(huì)提出報(bào)價(jià)。
OMIM全部后臺(tái)數(shù)據(jù)的獲取,可能有助于外顯子數(shù)據(jù)分析中對(duì)候選基因的篩選。但這些基因一般是已知的、與該疾病有較強(qiáng)關(guān)聯(lián)的基因,由于個(gè)體的異質(zhì)性,特定疾病中OMIM收錄的基因可能不全。
往期精品(點(diǎn)擊圖片直達(dá)文字對(duì)應(yīng)教程)
機(jī)器學(xué)習(xí)
后臺(tái)回復(fù)“生信寶典福利第一波”或點(diǎn)擊閱讀原文獲取教程合集
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎(jiǎng)勵(lì)來咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎(jiǎng)總結(jié)
以上是生活随笔為你收集整理的数据库 | OMIM (在线人类孟德尔遗传)数据库简介的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ubuntu 系统中如何截图
- 下一篇: Mysql数据库使用及其问题合集一