刷新认知!基因表达,男女有别|Science、Cell等发布15篇人类遗传调控新成果
生物信息學(xué)習(xí)的正確姿勢
NGS系列文章包括NGS基礎(chǔ)、在線繪圖、轉(zhuǎn)錄組分析?(Nature重磅綜述|關(guān)于RNA-seq你想知道的全在這)、ChIP-seq分析?(ChIP-seq基本分析流程)、單細胞測序分析?(重磅綜述:三萬字長文讀懂單細胞RNA測序分析的最佳實踐教程)、DNA甲基化分析、重測序分析、GEO數(shù)據(jù)挖掘(典型醫(yī)學(xué)設(shè)計實驗GEO數(shù)據(jù)分析 (step-by-step))、批次效應(yīng)處理等內(nèi)容。
大約20年前,耗資30億美元的人類基因組計劃繪制出了首個人類基因組草圖。隨著這項規(guī)模宏大、影響深遠的基因測序項目的落幕,許多研究者相信他們能夠迅速找到導(dǎo)致糖尿病或精神分裂癥等復(fù)雜疾病的基因。但是他們很快就陷入了僵局,部分原因在于當(dāng)時的研究忽視了對控制基因在體內(nèi)表達位置和方式的“開關(guān)系統(tǒng)”。例如,正是這種基因調(diào)控系統(tǒng)使心臟細胞有別于腦細胞,使腫瘤有別于健康組織。如今,通過將人類2萬個編碼蛋白質(zhì)基因的活性水平與數(shù)百萬條調(diào)控DNA序列的變異相關(guān)聯(lián),一項長達10年的大規(guī)模研究已經(jīng)開始填補這一空白。
本周,“基因型-組織表達研究聯(lián)盟”(Genotype-Tissue Expression Consortium)結(jié)束了為期10年的多機構(gòu)研究工作,于Science、Cell等期刊發(fā)布了斥資1.5億美元的“基因型-組織表達項目”(The Genotype-Tissue Expression (GTEx) Project)最后一期共計15項研究成果,介紹了跨細胞類型和組織的遺傳調(diào)控變異綜合圖譜,并分析了這些調(diào)控變化如何增加疾病風(fēng)險和促進疾病特征的發(fā)展。據(jù)悉,本周發(fā)表的15篇最新論文基于GTEx V8版本數(shù)據(jù)集。研究人員對來自838名死亡捐贈者49個組織的15,201份樣本進行了RNA測序,并分析了每個捐贈者的全基因組測序數(shù)據(jù)。整個研究使用的一種關(guān)鍵方法為基因表達數(shù)量性狀位點(eQTL)分析,以鑒定影響基因表達的遺傳變異以及分析剪接變異數(shù)量性狀位點(sQTL);其中一篇論文還使用CRISPR分析了罕見病的調(diào)控變異。最終,共有五篇論文發(fā)表于Science,兩篇發(fā)表于Science Advances,一篇發(fā)表于Cell,五篇發(fā)表于Genome Biology,一篇發(fā)表于Genetic Epidemiology,最后一篇發(fā)表于Genome Medicine。
圖:GTEx v8研究樣本及數(shù)據(jù)類型
正如前文所言,科學(xué)家們多年以來就意識到,基因組并不僅僅只是編碼蛋白質(zhì)的一系列遺傳密碼。它同時也是一塊巨大的“開關(guān)板”,充滿了可控制基因活性的DNA序列。事實上,基因組在調(diào)控方面的復(fù)雜性已極大地阻礙了研究者們對疾病遺傳學(xué)基礎(chǔ)的探索和靶向特定致病性DNA藥物的開發(fā)。但近年來,一些大型研究也已聚焦于基因調(diào)控開關(guān)的位置、調(diào)控開關(guān)所控制的特定基因以及調(diào)控開關(guān)在體內(nèi)激活或抑制基因活性的具體部位。
為了深入了解基因在人體中的表達方式以及調(diào)控方式,美國國立衛(wèi)生研究院共同基金(NIH Common Fund)于2010年啟動了“基因型-組織表達項目”(The Genotype-Tissue Expression (GTEx) Project),并在2013年提供了對GTEx數(shù)據(jù)資源訪問的GTEx門戶網(wǎng)站(http://www.gtexportal.org/home/)。當(dāng)時,上百位科學(xué)家聯(lián)名在Nature Genetics期刊發(fā)表文章介紹了GTEx項目,并成立了“基因型-組織表達研究聯(lián)盟”(Genotype-Tissue Expression Consortium)。目前,GTEx項目已經(jīng)建立了一個數(shù)據(jù)資源和組織庫,用于研究在多種人類組織和個體中遺傳變異與基因表達之間的關(guān)系,以及男性和女性之間基因表達的差異。對于此類研究,研究人員往往需要獲取大量人類器官的組織樣本,但由于GTEx項目所需組織樣本種類太多,因此研究人員將視線轉(zhuǎn)移到短期逝世的個體中——這些死者的親屬將遺體捐贈出來用于研究。截至目前,GTEx項目已經(jīng)從約960名捐獻者中收集了多種人體組織(包括腦、心臟、肺、乳房、皮膚和全血等)和30,000多份樣本。這些組織和樣本由美國國家癌癥研究所的人類癌癥生物樣本信息資源庫代表GTEx項目進行存儲。
GTEx項目獲得了具體的基因調(diào)控情況,確定了當(dāng)某基因附近200萬個堿基范圍內(nèi)的DNA序列發(fā)生細微改變后會開啟或者關(guān)閉哪些基因的表達。此外,GTEx項目也從每位捐贈者體內(nèi)獲取了多個組織的遺傳物質(zhì),評估這些遺傳物質(zhì)之間的差異,從而詳細記錄基因調(diào)控序列在不同細胞類型中的影響范圍——有的調(diào)控序列能夠影響所有組織中某個基因的表達,而其他調(diào)控序列只會影響幾種或一種組織內(nèi)的基因表達情況。2015年,GTEx項目發(fā)布了第一個階段性成果,在Science期刊上發(fā)表3項基因表達相關(guān)研究成果。隨著研究的深入,GTEx項目進一步于2017年10月在Nature期刊發(fā)表了二期共計4項研究成果。目前,GTEx項目資源正在幫助研究人員了解癌癥、心臟病、帕金森癥和糖尿病等常見疾病的遺傳易感性。
對于本次發(fā)布的最新研究成果,在Science的核心論文中,研究人員描述了其目標(biāo)和方法,并強調(diào)了數(shù)據(jù)集中捐贈者祖先和性別的多樣性。在838名捐贈者中,有715名(85.3%)為歐洲裔美國人,103名(12.3%)為非裔美國人,12名(1.4%)為亞裔美國人,16名(1.9%)為西班牙裔或拉丁裔;其中男性557名(66.4%),女性281名(33.5%)。研究人員指出,這些跨組織不同類型數(shù)據(jù)之間共享的高度相似模式表明,從細胞類型組成到轉(zhuǎn)錄組變異和遺傳調(diào)控效應(yīng)具有共享的生物學(xué)基礎(chǔ)。這些結(jié)果表明,組織間共享的細胞類型可能是組織共享遺傳調(diào)控作用的關(guān)鍵因素。在Science雜志發(fā)表的其他四篇論文中,研究人員還分別探討了性別對人體組織基因表達的影響、跨組織基因表達的細胞類型特異性遺傳調(diào)控、人類組織中端粒長度的決定因素,以及在人類組織中轉(zhuǎn)錄組特征中發(fā)現(xiàn)的功能性稀有遺傳變異。另外,在發(fā)表于Science Advances的兩篇文章中,研究人員分別分享了組織特異性遺傳特征如何在臨床試驗中為藥物副作用的預(yù)測提供信息,以及其開發(fā)的一種名為“PhenomeXcan”的資源,可通過轉(zhuǎn)錄組將基因組映射到表型組。而在發(fā)表于Cell的文章中,由斯坦福大學(xué)研究人員領(lǐng)導(dǎo)的小組則報告了人體的定量蛋白質(zhì)組圖譜。
圖:GTEx最新研究總覽
回顧GTEx項目的十年歷程以及該聯(lián)盟完成的工作,GTEx的共同負責(zé)人、紐約基因組中心人類遺傳學(xué)家Tuuli Lappalainen表示,研究人員已經(jīng)獲得了大量了生物學(xué)知識,并且能夠回答有關(guān)基因組功能的許多問題?!拔艺J為GTEx在許多方面都履行了諾言。它提供了非常全面的數(shù)據(jù)。而且,這些年來的技術(shù)發(fā)展引入了回答這些問題的新途徑和方法?!彼€表示,在過去的10年中,GTEx數(shù)據(jù)可以通過門戶網(wǎng)站廣泛獲取。與此同時,該聯(lián)盟還向更大的研究團體授權(quán)以推動功能基因組學(xué)研究,為GWAS研究提供支持,并為疾病相關(guān)變異的潛在調(diào)控作用研究提供理解。癌癥基因組學(xué)界也廣泛使用GTEx來推動其研究,研究人員也在使用GTEx來尋找尋找特定基因剪接模式或變異的答案。她還補充說,盡管該GTEx目前已經(jīng)發(fā)布了海量數(shù)據(jù)和大量論文,但仍有更多工作要做。例如,她計劃研究將基因組和RNA測序數(shù)據(jù)以及表型數(shù)據(jù)結(jié)合起來的方法,以更好地了解疾病機制,并且還正在考慮研究環(huán)境因素和遺傳因素的結(jié)合如何影響疾病風(fēng)險。
隨著GTEx項目的結(jié)束,據(jù)悉美國國立衛(wèi)生研究院正在計劃一項發(fā)育性GTEx研究,將招募20歲以下的志愿者來創(chuàng)建一個從出生到成年的基因表達圖譜。研究人員表示,對于這樣的后續(xù)項目,一個更加多樣化的組織捐贈者群體將是非常有價值的。雖然GTEx項目一開始也是為了這個目標(biāo)而努力的,但由于組織和器官捐贈者大多為白人,導(dǎo)致該愿景最終并未完全實現(xiàn)。到目前為止,雖然GTEx項目還不能完全說明基因組是如何驅(qū)動人類各種組織的產(chǎn)生或引發(fā)各類疾病。但研究人員預(yù)測,GTEx資源一定會被反復(fù)使用,并將產(chǎn)生一些他們無法預(yù)測的用途。
附15項研究成果速覽
Science
題目:GTEx項目構(gòu)建人體組織遺傳調(diào)控效應(yīng)圖譜
The GTEx Consortium atlas of genetic regulatory effects across human tissues
研究團隊介紹了GTEx(v8)版本數(shù)據(jù)的分析,檢測了來自838個死后捐贈者49個組織的15201個RNA測序樣本。該研究全面表征了順式和反式基因表達和剪接的遺傳關(guān)聯(lián),表明幾乎所有基因都存在調(diào)節(jié)關(guān)聯(lián),并描述了潛在的分子機制及其對等位基因異質(zhì)性和復(fù)雜性狀的多效性的貢獻。
文章鏈接:
https://science.sciencemag.org/content/369/6509/1318.abstract
題目:性別對跨人體組織基因表達的影響
The impact of sex on gene expression across human tissues
研究團隊通過GTEx(v8)版本數(shù)據(jù),分析了44個人體組織來源的基因表達和基因表達的遺傳調(diào)控中的性別差異。結(jié)果證明,性別可影響整個人體組織樣本的基因表達水平和細胞組成,人類37%的基因在至少一個組織中表現(xiàn)出性別偏向的表達。同時,研究人員確定了具有性別差異作用的順式表達定量性狀基因座(eQTLs),并表征其細胞起源。通過將性別偏見的eQTL與全基因組關(guān)聯(lián)研究數(shù)據(jù)進行整合,最終確定了58個由單一性別基因表達的遺傳調(diào)控驅(qū)動的基因-性狀關(guān)聯(lián)。
文章鏈接:
https://science.sciencemag.org/content/369/6509/eaba3066
題目:細胞類型特異性基因調(diào)控基因在人體組織中的表達
Cell type–specific genetic regulation of gene expression across human tissues
GTEx項目已經(jīng)確定了人體組織中大部分基因的順式數(shù)量性狀基因座(QTL)表達和剪接定量性狀基因座。該研究繪制了細胞類型豐度和基因型的計算估計之間的相互作用,以確定七種細胞類型的細胞類型-相互作用QTL,并表明細胞類型相互作用表達QTL比組織特異性順式eQTL能提供更好的組織特異性分辨率。對87個復(fù)雜性狀遺傳關(guān)聯(lián)的分析表明,細胞類型-相互作用QTL發(fā)揮了作用,并能夠發(fā)現(xiàn)數(shù)百個此前未知的共定位基因座。
文章鏈接:
https://science.sciencemag.org/content/369/6509/eaaz8528
題目:端粒長度在人體組織中的決定性作用
Determinants of telomere length across human tissues
研究團隊表征了來自6391個組織樣本端粒長度的變異性,這些樣本代表了GTEx項目的20多個組織類型和952個個體。研究描述了不同組織類型之間的差異,以及組織類型之間的正相關(guān)以及與年齡和血統(tǒng)的關(guān)聯(lián),發(fā)現(xiàn)遺傳變異可影響多種組織類型中的端粒長度,并且端粒長度可能介導(dǎo)年齡對基因表達的影響。
文章鏈接:
https://science.sciencemag.org/content/369/6509/eaaz6876
題目:跨人體組織的轉(zhuǎn)錄特征可識別功能性罕見遺傳變異
Transcriptomic signatures across human tissues identify functional rare genetic variation
確定稀有遺傳變異的功能和表型影響是一項重大挑戰(zhàn)。研究團隊通過分析基因表達、等位基因特異性表達和多組織RNA測序數(shù)據(jù)的可變剪接,擴展了基因驅(qū)動的轉(zhuǎn)錄組異常檢測,并證明了每種信號都可以指導(dǎo)稀有變異的獨特分類。該研究結(jié)果將成千上萬的稀有變異鏈接到各種分子效應(yīng),為將稀有變異影響轉(zhuǎn)錄組與人類特征相關(guān)聯(lián)提供了證據(jù)。
文章鏈接:
https://science.sciencemag.org/content/369/6509/eaaz5900
Science Advances
題目:組織特異性遺傳特征為臨床試驗中藥物副作用的預(yù)測提供依據(jù)
Tissue-specific genetic features inform prediction of drug side effects in clinical trials
通過結(jié)合48個組織中的基因表達和eQTL,該研究評估了> 360000個英國生物庫個體中1167個表型的全表型關(guān)聯(lián)研究(PheWAS),以分析是否可在臨床試驗中預(yù)測藥物副作用。研究確定了具有五個遺傳特征的藥物靶基因,包括基因表達的組織特異性。與沒有這種特征的基因相比,其帶來的副作用風(fēng)險增加了2.6倍。該研究展示了來自多個組織的PheWAS和eQTL數(shù)據(jù)用于藥物副作用預(yù)測的效用,并強調(diào)了組織特異性藥物遞送的需求。
文章鏈接:
https://advances.sciencemag.org/content/6/37/eabb6242
題目:PhenomeXcan:通過轉(zhuǎn)錄組將基因組映射到表型
PhenomeXcan: Mapping the genome to the phenome through the transcriptome
PhenomeXcan是將來自GTEx(v8)49個組織的4091個性狀轉(zhuǎn)錄組數(shù)據(jù)與GWAS研究統(tǒng)計數(shù)據(jù)中887萬個變體整合的一個可查詢基因平臺,其中包括22515個基因。研究團隊開發(fā)了一種新穎的貝葉斯共定位方法,即快速富集估計輔助共定位分析(fastENLOC),可先考慮可能的因果基因-性狀關(guān)聯(lián)。利用PhenomeXcan,研究團隊提供了新的和未報告的基因與表型關(guān)聯(lián)以及復(fù)雜的基因特征簇。PhenomeXcan(phenomexcan.org)為轉(zhuǎn)錄研究提供了對復(fù)雜數(shù)據(jù)的廣泛及用戶友好的訪問。
文章鏈接:
https://advances.sciencemag.org/content/6/37/eaba2083
Cell
題目:人體定量蛋白質(zhì)組圖譜
A Quantitative Proteome Map of the Human Body
研究團隊從32個正常人體組織中超過12000個基因中定量了相對蛋白質(zhì)水平。通過鑒定組織特異性或組織富集的蛋白質(zhì),并將其與轉(zhuǎn)錄組數(shù)據(jù)進行比較,許多普遍存在的轉(zhuǎn)錄本被發(fā)現(xiàn)可編碼組織特異性蛋白質(zhì)。RNA和蛋白質(zhì)富集的差異揭示了分泌蛋白合成和作用的潛在位點。此外,該研究表明蛋白質(zhì)組織富集信息可以解釋遺傳疾病的表型,而僅靠轉(zhuǎn)錄本信息是無法獲得的。
文章鏈接:
https://www.cell.com/cell/fulltext/S0092-8674(20)31078-3
Genome Biology
題目:Primo:整合多個GWAS和omics QTL匯總統(tǒng)計數(shù)據(jù),闡明與性狀相關(guān)SNP的分子機制并檢測復(fù)雜性狀的多效性
Primo: integration of multiple GWAS and omics QTL summary statistics for elucidation of molecular mechanisms of trait-associated SNPs and detection of pleiotropy in complex traits
為全面解釋已知的性狀相關(guān)SNP如何影響復(fù)雜性狀,研究團隊提出了一種Primo方法,用于對來自不同細胞條件或研究的系列omics QTL匯總統(tǒng)計數(shù)據(jù)進行GWAS統(tǒng)計數(shù)據(jù)的綜合分析。Primo方法可研究SNP與復(fù)雜和組學(xué)特征的關(guān)聯(lián)模式。在含有已知易感位點的基因區(qū)域,Primo可進行條件關(guān)聯(lián)分析,以解釋連鎖不平衡問題。Primo允許進行未知的異質(zhì)性和樣本相關(guān)性研究。
文章鏈接:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-02125-w#auth-Lin_S_-Chen
題目:sn-spMF:基質(zhì)分解告知組織特異性基因表達的遺傳調(diào)控
sn-spMF: matrix factorization informs tissue-specific genetic regulation of gene expression
研究團隊開發(fā)了一個受約束的矩陣分解模型sn-spMF,以學(xué)習(xí)組織共享的模式將其應(yīng)用于GTEx項目的49個人體組織。學(xué)習(xí)因子(learned factors)可反映具有已知生物學(xué)相似性的組織,并識別可能介導(dǎo)組織特異性作用的轉(zhuǎn)錄因子。sn-spMF可在https://github.com/heyuan7676/ts_eQTLs獲取。
文章鏈接:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-02129-6
題目:大量跨人體組織等位基因的表達數(shù)據(jù)
A vast resource of allelic expression data spanning human tissues
研究團隊介紹并演示了從GTEx(v8)版本中生成的大量等位基因表達資源的實用性,其中包含15253個樣本,覆蓋54個人體組織,SNP級別的等位基因總計為4.31億,單倍型水平的總量為1.53億。此外,研究團隊擴展了phASER工具,允許使用單倍型水平的等位基因數(shù)據(jù)估算順式調(diào)節(jié)變體的效應(yīng)大小。這是迄今為止最大的等位基因資源,且能夠公開提供單倍型水平的等位基因數(shù)據(jù)。
文章鏈接:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-02122-z
題目:GTEx中外源和祖源對eQTL分析和GWAS共定位的影響
Impact of admixture and ancestry on eQTL analysis and GWAS colocalization in GTEx
研究團隊在GTEx(v8)中識別了117個具有高度群體混合個體的子集,并估計了全基因組的局部祖源信息。在七個組織中使用混合樣本進行全基因組順-eQTL定位,并通過祖源信息進行調(diào)整。最后,該研究確定了與本地祖先高度相關(guān)的一部分eQTL變體。為GTEx(V8)版本中的混合個體提供了本地祖先圖,并描述了祖先和混合物對基因表達,eQTL和GWAS共定位的影響。
文章鏈接:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-02113-0
題目:PTWAS:利用TWAS概率分析研究組織相關(guān)復(fù)雜性狀的因果分子機制
PTWAS: investigating tissue-relevant causal molecular mechanisms of complex traits using probabilistic TWAS analysis
研究團隊提出了一種新的計算框架,即概率全轉(zhuǎn)錄組關(guān)聯(lián)研究(PTWAS),以研究基因表達與復(fù)雜性狀之間的因果關(guān)系。PTWAS應(yīng)用工具變量分析的既定原則,利用概率eQTL注釋來描述和解決TWAS中出現(xiàn)的獨特挑戰(zhàn)。PTWAS不僅具有比現(xiàn)有方法更高的功能,而且還提供了新穎的功能來評估因果關(guān)系假設(shè),以及評估組織或細胞類型特異性基因?qū)π誀畹挠绊憽Q芯繄F隊通過分析來自GTEx(v8)49個組織的eQTL數(shù)據(jù)和114個復(fù)雜性狀的GWAS統(tǒng)計數(shù)據(jù)證明了PTWAS的強大功能。
文章鏈接:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-02026-y
Genetic Epidemiology
題目:精細映射和QTL組織共享信息提高了因果基因識別的可靠性
Fine‐mapping and QTL tissue‐sharing information improves the reliability of causal gene identification
近年來,通過轉(zhuǎn)錄表達整合轉(zhuǎn)錄組學(xué)研究和GWAS研究已得到廣泛應(yīng)用,使得GWAS基因座的功能表征和因果基因的預(yù)測成為可能。但最佳的預(yù)測性能模型不一定會導(dǎo)致更可靠的因果基因發(fā)現(xiàn)。為在不增加假陽性的情況下改善目標(biāo)基因的發(fā)現(xiàn),研究團隊使用GTEx項目中948個供體54個組織的17382個RNA測序樣本的表達和剪接數(shù)據(jù),開發(fā)并比較了多種轉(zhuǎn)錄組預(yù)測方法。研究發(fā)現(xiàn),通過精細映射(dap-g)和跨組織借用信息(masher)來反映具有因果概率的預(yù)測模型可以在重要關(guān)聯(lián)的數(shù)量和比例方面提供更好的性能。所有的預(yù)測模型都可以在predictdb.org上公開獲得。
文章鏈接:https://onlinelibrary.wiley.com/doi/full/10.1002/gepi.22346
Genome Medicine
題目:用于檢測轉(zhuǎn)錄物變體調(diào)控作用的多克隆等位基因表達測定方法
A polyclonal allelic expression assay for detecting regulatory effects of transcript variants
研究團隊提出了一種利用CRISPR / Cas9檢測基因變異在轉(zhuǎn)錄組中調(diào)節(jié)作用的實驗方法,然后進行靶向測序。利用該檢測方法,研究團隊對整個基因組和兩個孟德爾遺傳病基因中的32個提前終止變異體,HEK293T細胞中的33個eQTL預(yù)測因果變異體和62個對照變異體進行了分析,并復(fù)制HeLa細胞中的一部分變異體。結(jié)果顯示,該方法能夠捕獲eQTL變體以及提前終止變異體觸發(fā)的無意義介導(dǎo)衰變的調(diào)節(jié)作用,表明該方法可用于驗證遺傳變異的轉(zhuǎn)錄組水平效應(yīng)。
文章鏈接:
https://genomemedicine.biomedcentral.com/articles/10.1186/s13073-020-00777-8#article-info
參考資料:
1.?‘Invaluable’ database helps solve mystery of how genes are regulated
https://www.sciencemag.org/news/2020/09/invaluable-database-helps-solve-mystery-how-genes-are-regulated
2. GTEx Studies Provide Comprehensive Map of Genetic Regulatory Variation Across Cell Types, Tissues
https://www.genomeweb.com/genetic-research/gtex-studies-provide-comprehensive-map-genetic-regulatory-variation-across-cell#.X1rSiHot1PY
3.?https://commonfund.nih.gov/GTex
4.?https://commonfund.nih.gov/gtex
往期精品(點擊圖片直達文字對應(yīng)教程)
后臺回復(fù)“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
喜歡別忘了點“在看”呦!
總結(jié)
以上是生活随笔為你收集整理的刷新认知!基因表达,男女有别|Science、Cell等发布15篇人类遗传调控新成果的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 26岁一年发4篇Cell,他说搞科研要有
- 下一篇: RFE筛选出的特征变量竟然是Boruta