中国北方汉族人、日本人基因完全重叠!深入揭秘
生、長、衰、病、老、死,一切都與基因有關。不同地域和民族的人,其基因也千差萬別。
鑒于此,最大規模的中國人基因庫研究結果于近日首次發表——上海交通大學醫學院附屬瑞金醫院內分泌科聯合全國29家研究機構、醫院,首次公布了來自27個省、直轄市8個民族的1萬余人的高深度全基因組測序數據及表型的系統性分析結果。
2020年4月30日,上述團隊題為The ChinaMAP analytics of deep whole genome sequences in 10,588 individuals(中國代謝解析計劃對10588例樣本的深層全基因組序列的分析)的論文發表于由中國科學院主管的國際性學術月刊《CellResearch》(細胞研究)。
中國代謝解析計劃
糖尿病、骨質疏松、低血糖、痛風,這些病癥我們已經不陌生了。
本質上,它們都屬于“代謝性疾病”。
顧名思義,這是一種因代謝問題引起的疾病。作為世界范圍內最常見、發展最迅速的健康問題,代謝性疾病在很大程度上決定著人類的死亡率,也正在成為一項日益嚴重的公共衛生挑戰。
世界上沒有完全相同的兩片樹葉,而同一種疾病背后也存在個體差異。想要更好地進行個體風險評估、提升預防、治療代謝性疾病的效果,關鍵在于了解代謝性狀的遺傳結構。
實際上,最簡單粗暴的方法就是對大規模人群進行全面的遺傳分析。
如今,基因庫的概念已經并不稀奇了,歐美已經有了一些出名的人類基因組學和生物信息學數據庫,比如英國生物樣本庫(UKbio bank)、基因組聚集數據庫(gnomAD)、千人基因組計劃(1KGP)、UK10K計劃、dbSNP和多組學精準醫學研究計劃(TOPMed)。
考慮到東亞人和歐洲人在遺傳背景和種群特征方面存在的巨大差異,一項”中國代謝解析計劃“(ChinaMetabolicAnalyticsProject,ChinaMAP)應運而生。
根據上海交通大學醫學院附屬瑞金醫院公眾號介紹,該醫院此前牽頭開展了多項覆蓋全國的隊列研究,基于相關研究,國家代謝性疾病臨床醫學研究中心(上海)依托了轉化醫學國家重大科技基礎設施(上海)和醫學基因組學國家重點實驗室,實施了這一計劃。
ChinaMAP旨在全面囊括漢族及主要少數民族在不同地理區域的多樣化遺傳結構,并調查其對代謝疾病的影響以及廣泛的生物醫學相關的定量特征。
ChinaMAP基于三個大型隊列:
2010年中國非傳染性疾病監測:全國范圍內15萬名參與者的研究;
中國糖尿病患者癌癥風險評估:25萬名參與者的研究;
上海城市化進程中的社區心血管風險:5萬名參與者的研究。
10588位參與者的全基因組測序深度數據
在ChinaMAP一期階段,研究團隊27個省的8個民族(漢族,回族,滿族,苗族,蒙古族,彝族,藏族和壯族)中隨機選擇參與者,毫無偏倚的選擇、過濾,進行了10588位參與者的全基因組測序深度數據,最終完成了中國人群遺傳變異數據構建、中國人群體結構分析、基因組特征比較,及變異頻譜和致病性變異解析。
其中,平均基線年齡為54歲,女性占比為64.8%。
基因在特定的位點上,DNA序列存在差異,也就是說,基因組中散在的堿基不同,比如點突變、單個堿基的置換、缺失和插入,這實際上也就是基因多態性的一種表現,這在生物學上被稱為SNP,即single nucleotide polymorphism,即單核苷酸多態性。
在ChinaMAP一期數據庫中,共有1.36億個SNP和1000萬個插入或缺失位點,其中一半都屬于多個國際通用的數據庫中沒有的新位點。
下圖是與TOPMed、gnomAD、dbSNP和1KGP數據庫相比,ChinaMAP中識別出的已知和新型SNP的數目和等位基因頻譜。
漢族可分成7個亞群
該研究表明,漢族人群可分成7個亞群,不同地域的變異特征與人口遷徙相關。
如下圖所示,漢族人群可分成7個亞群:北方漢族(北京、天津、河南、河北、山東、遼寧、吉林、黑龍江、山西),西北漢族(甘肅、陜西),東部漢族(江蘇、浙江、上海、安徽),中部漢族(湖北),南方漢族(貴州、四川、重慶、湖南、云南、江西),東南漢族(福建)和嶺南漢族(廣東、廣西)。
另一方面,藏族、彝族、蒙古族、苗族、壯族有獨特的人群聚類,滿族和北方漢族相近,回族和西北、北方漢族相近。
值得一提的是,不同地域的變異特征與歷史上的人口遷徙相關。例如,西北地區(甘肅省)河西走廊地區是絲綢之路、古代人口遷徙的重要地區,因此有更多的個體變異特征。
少數民族(藏族,蒙古族和回族)的平均個體變異水平高于平均,而苗族個體的變異水平總體下降。
不難看出,基因組分析揭示了地理區域中多民族人口的遺傳特征及其多樣性、復雜性。
日本與中國北方漢族人群聚類完全重疊
就遺傳特征而言,中國人與非洲差距最大,日本與中國北方漢族人群聚類完全重疊。
如下圖所示,中國人的遺傳特征與歐洲、非洲、南亞、拉丁美洲人口之間存在著巨大的差異。Fst取值范圍為[0,1],最大值1表示完全分化;最小值0意味著不同地方群體遺傳結構完全一致,沒有分化。
其中,非洲人口和中國人口顯示出最大的遺傳距離(MSL,塞拉利昂,Fst=0.15;ESN,尼日利亞,Fst=0.15;YRI,尼日利亞,Fst=0.149)。
同為東亞血統的中國、日本、越南人口的遺傳特征非常相似(JPT,日本,Fst=0.007;KHV,越南,Fst=0.005)。
另外,研究者在成分分析中發現,日本人群與中國北方漢族人群聚類完全重疊(日本為紅點部分)。
可見,研究成果提供了漢族和少數民族的精確遺傳結構,揭示了中國人口的基因組多樣性和分布。
中國人得糖尿病和肥胖的風險不同于歐美
研究人員進行了多基因風險評分(PRS),包括個體遺傳風險估計、點單變體關聯分析和稀有變體關聯分析序列內核關聯檢驗(SKAT)。
實際上,2型糖尿病和肥胖都是很常見的代謝性疾病,因此團隊也對二者進行了多基因風險評分。
在對2型糖尿病進行的多基因風險評分中,研究團隊將評分、年齡和血糖值以三維的形式進行顯示。
多基因風險評分表明,2型糖尿病高風險和低風險的個體之間存在非常顯著的血糖差異,高風險個體隨著年齡的增長,空腹(FBG)和餐后2小時血糖(2h-PBG)都顯著高于中風險和低風險者。
而在對體重指數BMI進行的分析中,研究團隊發現了東亞人的特異性CADM2基因位點。
CADM2此前經動物研究證實可參與調節體重和能量穩態。
下圖為體重指數、空腹血糖和餐后2小時血糖的多基因風險評分。
值得一提的是,中國人患2型糖尿病和肥胖的風險基因不同于歐美,這也進一步證明了建立中國人自己的基因庫的必要性。
藏族、蒙古族和彝族酒量最好
此外,研究人員也探究了參與者的營養和藥物代謝的流行病學和地理特征。
一方面,研究團隊將關注點放在了酒精代謝能力上面。
從地理上講,北方人比南方人酒精代謝能力更高,也就是說酒量更好;藏族、蒙古族和彝族的酒精代謝能力最高,廣東、福建人該項能力最低。而不同地區人群對咖啡因的代謝能力相似。
另一方面,研究團隊對華法林(Warfarin)的減量使用、抗血小板藥物氯吡格雷(Simvastatin)的適用人群分類、他汀類降脂藥的副作用風險人群進行了分析,這也進一步佐證了針對我國人群特征的藥物基因組研究和藥物基因檢測的重要性。
結合上述研究成果可以看出,這一大規模中國人基因庫對代謝類疾病的評估、對重大慢性疾病的預防、對個體健康的管理和公共衛生決策,都具有不小的價值。
總結
以上是生活随笔為你收集整理的中国北方汉族人、日本人基因完全重叠!深入揭秘的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: stemwin10版(stem win1
- 下一篇: 哪个品牌靠谱?12万块硬盘最新故障率报告