易基因 | 文献速递:RRBS方法绘制1538例乳腺癌甲基化图谱并预测癌症发生/预后
大家好,這里是專注表觀組學十余年,領跑多組學科研服務的易基因。
錯過RRBS技術在人和小鼠疾病表觀遺傳特征研究的可點:Mol Biol Evol | 利用RRBS技術多維度分析人和小鼠的疾病表觀遺傳特征
今天一起來看看發表于Nat Commun期刊的利用RRBS測序分析技術繪制了1538例乳腺癌組織樣本和244個相鄰正常組織樣本的DNA甲基化圖譜,并揭示了乳腺癌的形成和進展與復制相關的DNA甲基化時鐘過程(replication-linked clock)、表觀基因組不穩定性(epigenomic instability)和啟動子/遠端元件的順式調控(cis-regulation)有關。
標題:DNA methylation landscapes of 1538 breast cancers reveal a replication-linked clock,epigenomic instability and cis-regulation
期刊:nature communications(Nat Commun,英國nature集團旗下的子刊,專門發表生物學、物理學和化學等各領域的高質量研究論文。)
2021影響因子: IF 14.919/Q1
發表時間:2021.09.13
方法:RRBS
關于RRBS
簡化甲基化測序(Reduced Representation Bisulfite Sequencing,RRBS)是利用限制性內切酶對基因組進行酶切,富集啟動子及CpG島等重要的表觀調控區域并進行重亞硫酸鹽測序。該技術顯著提高了高CpG區域的測序深度,在CpG島、啟動子區域和增強子元件區域可以獲得高精度的分辨率,是一種準確、高效、經濟的DNA甲基化研究方法,在大規模臨床樣本的研究中具有廣泛的應用前景。為了適應科研技術的需要,我們進一步開發了可在更大區域內捕獲CpG位點的雙酶切RRBS(dRRBS),可研究更廣泛區域的甲基化,包括CGI shore等區域。
為助力低樣本量多維度分析,我們開發了富集覆蓋CpG島、啟動子、增強子、CTCF結合位點的甲基化靶向測序方法:extended-representation bisulfite sequencing(XRBS),實現了高靈敏度和樣本復用,使其具有高度可擴展性,并適用于有限的樣本和單個細胞。
研究摘要
DNA甲基化在癌癥中是異常的,但這種表觀遺傳學變化的動力學作用、調控作用和臨床意義仍然知之甚少。
METABRIC隊列中包含了2000多個乳腺癌樣本,這些樣本此前已在臨床、遺傳和轉錄方面進行了廣泛表征。本文作者使用RRBS測序分析技術對其DNA甲基化狀態進行研究。來自METABRIC隊列的1538例乳腺癌組織和244個相鄰正常乳腺組織的簡化甲基化測序(RRBS)譜,在豐富的基因組、轉錄組和臨床數據背景下對DNA甲基化進行深度分析。來自免疫和間質標記物的腫瘤DNA甲基化狀態被反褶積(deconvoluted),從而導致在非CpG位點發現與全基因組甲基化丟失的腫瘤復制相關時鐘(replication-linked clock)。出乎意料的是,在大部分CpG區域甲基化遵循兩個獨立于復制的獲得(MG)或丟失(ML)過程,稱之為表觀基因組不穩定性,表觀基因組不穩定性與腫瘤分級/分期、TP53突變和較差預后相關。另外,研究人員在數百個啟動子和數千個遠端元件中發現了順式特異性甲基化(cis-specific methylation)和表達相關,包括一些已知的腫瘤抑制因子和致癌基因,證明了數百個啟動子和數千個遠端元件中的甲基化水平和特異性順式作用下的基因表達相關,突出了全基因組甲基化水平變化在腫瘤轉錄改變中的重要作用,包括典型的BRCA1高甲基化效應。
項目設計
(1)樣本選取:
從METABRIC數據庫中選取1538個原發性乳腺癌組織樣本和244個相鄰組織的正常樣本,共1782個樣本進行了DNA甲基化測序分析(RRBS),并建立導致乳腺癌DNA甲基化過程的多因素統一模型。
?(2)RRBS測序流程
實驗結果
(1)乳腺癌與復制相關的DNA甲基化時鐘過程相關
(1.1)METABRIC 隊列的甲基化分析
從METABRIC隊列中選取1538個原發性乳腺癌組織樣本和244個相鄰組織的正常樣本,利用可獲得的臨床、基因組和轉錄組數據來分析甲基化過程(圖1a),研究人員利用RRBS測序方法對這1782個樣本以30.4B reads來覆蓋廣泛的基因組分布,有助于分析全基因組甲基化變化趨勢及調控元件和啟動子的甲基化變化。RRBS測序方法使93%的樣本被超過1 M CpG位點的10個以上reads覆蓋(圖1b),9%的reads被映射到真正的啟動子區域(圖1c),75%的啟動子區域平均覆蓋超過20個reads(平均覆蓋246個),有助于下游的定量分析(圖1d)。
(1.2)乳腺癌甲基化的分層建模
以METABRIC數據庫為模型,研究人員開發了一種半監督算法(Methylayer),用于腫瘤甲基化動力學的分層建模(圖1e)。Methylayer的基本原理依賴于基因表達、遺傳學和臨床信息的整合,計算混雜因素(腫瘤微環境[TME]效應),以此推斷可隨機影響全基因組甲基化變化趨勢,Methylayer可以強有力地篩選表觀遺傳順式調控的候選基因,并得出預后指標。將Methylayer分別應用于METABRIC隊列的ER+和ER-腫瘤樣本,并比較兩類腫瘤樣本的動力學。
數據結果發現,基因表達的整合使Methyllayer將TME效應識別為主要數據混雜因素,從而促進從腫瘤活檢中獲得的甲基化圖譜多樣化(圖1f)。該算法在基因表達和啟動子甲基化狀態的相互關聯中檢測到一個強大的免疫標記,即TME標記與腫瘤分級相關(圖1g),并通過獨立的反褶積表達譜和病理指標進行驗證。在對TME標記進行推斷之后,研究人員應用了一種新的K-nn歸一化算法(K-nn normalization algorithm Methods,圖1h),該算法在推斷下游腫瘤甲基化區域時,驗證了Methyllayer顯著降低了TME偏差。
(1.3)復制相關的甲基化時鐘過程與腫瘤中甲基化丟失相關
與對照組相比,基于TME標準甲基化的Methyllayer聚類在腫瘤樣本中鑒定出一組高度相關的CpG區域 (圖1i),這一甲基化區域與腫瘤分級不相關(圖1j),將其標記為時鐘層(clock layer),盡管與啟動子相關的遠端定位相關,但時鐘層CpG顯示出較低的CpG含量(圖1k),因此在推定的調控元件(基于組蛋白修飾)中代表性不足。
基因組通過定義早期和晚期復制域的調控過程在S期復制。有趣的是,在S晚期復制域中,時鐘層的腫瘤甲基化減少更為強烈(圖1l,m)。這與此前研究一致,表明衰老和癌癥中DNA甲基化的丟失可能與復制過程中相關的甲基化異常積累(“epi-mutations”,表突變)相關。篩選跨METABRIC的基因表達特征并未發現與甲基化時鐘層相關的常規轉錄程序。總之,這些數據共同表明癌癥中甲基化丟失時鐘的動力學與基因組復制過程密切相關。
?Fig.1: Dissecting tumor, immune, and CAF methylation in the METABRIC cohort
(2)乳腺癌的表觀基因組不穩定性
Methyllayer分析鑒定出了兩個具有顯著不同特征的全基因組甲基化區域(圖2a)。一區為表觀基因組不穩定性甲基化獲得(MG)區,主要涉及在正常組織樣本中未甲基化,但在腫瘤組織樣本中呈現高甲基化水平的CpG區域(圖2b)。值得注意的是,45%中高CpG含量增強子和2995個啟動子顯示出與MG區(圖2c)的強相關性。另一區域占CpG位點的一小部分,是表觀遺傳不穩定性甲基化丟失(ML)區,涉及在正常組織樣本中部分甲基化,但在腫瘤中顯示低甲基化的區域。
量化METABRIC上的甲基化MG區和甲基化ML區,結果顯示ER+ 呈現腫瘤分級依賴性分布(圖2d、e,其中高分表示與正常組織的差異較大)。此外,MG區甲基化與大量基因的反式表達正相關(圖2f),包括有絲分裂紡錘體的形成和調控、DNA損傷修復、DNA復制、幾種胚胎發育同源盒轉錄因子(如早期間充質因子Msx1)、鈣信號傳導通路和甾醇代謝基因相關的基因(圖2g)。
以上分析表明,除復制相關的甲基化時鐘過程外,大量基因座(loci)還受到甲基化獲得 (MG) 和丟失 (ML) 過程的影響,并且該過程與腫瘤進展、基因組亞型和腫瘤基因表達狀態相關。
?Fig. 2: Epigenomic instability in breast cancers.
(3)在數百個啟動子和數千個遠端元件中發現了順式特異性甲基化和表達相關
研究人員通過比較啟動子甲基化與自身表達之間的相關性以及與其他9360個基因表達譜之間的相關性,并與隨機對照組進行比較,結果在ER+中鑒定出423個啟動子、ER?中鑒定出185個啟動子通過順式甲基化來調控表達(圖3a,b)。在順式作用下的甲基化和表達相關性研究中,觀察到腫瘤抑制和誘導基因與高甲基化相關(圖3c,d)。為了確定這些特定的順式調控基因哪些是共同調控基因組的一部分(圖3e),研究人員計算了基因表達譜的相關性,鑒定出這些特定基因不是常規表達基因組的一部分。值得注意的是,這些啟動子的epi-polymorphism分析驗證了甲基化多樣性顯著降低,特別是當甲基化水平較低時(圖3f,P?<0.001,表示這些位點的epi多態性較低),提示在腫瘤發生過程中這些位點的表觀遺傳特征一致。
隨后,研究人員為每個甲基化位點鑒定與其密切相關的基因表達譜,并選擇了位于直接染色體區域位點的最佳相關伙伴基因(i.e., its TSS)(圖3g,h)。epi-polymorphism分析在ER+中鑒定出2680個遠端順式調控元件,在ER?中鑒定出1332個遠端順式調控元件,且結果與啟動子一致。Motif分析及與ChIP-seq圖譜的對比表明啟動子和遠端元件位點的甲基化水平變化是由順式作用調控的,而不是由反式作用中的常規機制調控的。
總之,以上研究表明,盡管全基因組甲基化丟失時鐘和表觀基因組不穩定性涉及了基因組中幾乎所有的CpG,但啟動子和遠端元件的部分甲基化與順式作用調控下的數百個基因相關,并且可能特異性的調控這些基因。例如,BRCA1啟動子甲基化與乳腺癌ER-中的BRCA1基因表達呈特異性強相關性,而KRT7啟動子甲基化與ER+ 腫瘤中的KRT7基因表達相關(圖 3e),表明一些順式作用調控的基因如BRCA1參與腫瘤發生。
Fig. 3: Expression–methylation correlation in cis.
(4)乳腺癌的甲基化狀態與基因組畸變相關,并可預測生存率
研究人員使用降維算法工具(UMAP)對樣本的2D整體甲基化狀態進行映射,突出顯示所有乳腺癌組織樣本和正常組織樣本的表觀遺傳特征組合(圖 4a),篩選了5種與表觀遺傳不相關的METABRIC基因組數據。將腫瘤分為五個級別,并在每個級別檢測了 171 SNV基因(圖4b)的外顯率,結果揭示了與TP53、PIK3CA、CDH1、GATA3和CBFB SNV等基因的顯著強相關性(圖 4b),且在腫瘤內異質性突變程度較低。類似的分析驗證了ER+ 腫瘤中較高的表觀遺傳不穩定性與較高的染色體不穩定性(CIN)相關(圖 4c)。
為評估表觀遺傳特征的臨床影響,研究人員分析了按表觀遺傳評分分層來預測患者生存率(圖 4d),結果表明高MG表觀遺傳不穩定性預示著生存率低。ER+和 ER-腫瘤的五年生存率分別從 91% (64%) 降至 83% (55%)。而ML表觀遺傳不穩定性也與ER+腫瘤中較差的生存率相關。相比之下,與復制相關的丟失時鐘則顯示與患者生存率不相關。
最后,研究人員進行了Cox比例風險分析(Cox proportional hazard analysis),即使在考慮臨床、遺傳因素和轉錄評分的背景下,也證明了基于表觀遺傳不穩定性評分的15年預后價值(圖 4e)。總之,以上數據結果驗證了表觀遺傳特征,特別是表觀遺傳不穩定性和腫瘤的基因組特征及較差的預后相關。
?Fig. 4: Epigenomic instability correlates with genomic features and with poor survival.
易基因小結
在本研究中,研究人員對來自METABRIC數據庫的1538個原發性乳腺癌組織樣本和244個相鄰組織的正常樣本進行RRBS測序和深度分析,得出以下結論:
????? 癌癥中甲基化丟失時鐘的動力學與基因組復制過程密切相關
????? 癌癥中表觀遺傳特征不穩定性與腫瘤進展、基因組亞型和腫瘤基因表達狀態相關
????? 癌癥種啟動子和遠端元件位點的甲基化水平變化由順式作用調控
????? 癌癥的甲基化狀態與基因組畸變相關,并可預測生存率
以上研究結果揭示DNA甲基化狀態對腫瘤的發生、發展和預后有非常重要的作用,為臨床科研和診療工作帶來新的方向。
作為本研究的亮點技術——RRBS,易基因配合強大的生信分析實力,提供的不僅是海量的測序數據,而且可以根據您的研究目的,有針對性地挖掘提煉出個性化分析結果及見刊圖片。
文獻來源:DOI: 10.1038/s41467-021-25661-w
?
文獻解讀:
文獻速遞 | RRBS方法繪制1538例乳腺癌甲基化圖譜并預測癌癥發生/預后https://mp.weixin.qq.com/s?__biz=MzAwNTY3NDIxMw==&mid=2650648958&idx=1&sn=50180a68424143c0300cb279dbd9b45b&chksm=831014f4b4679de248f2936a8d7e8baec57cd589cd5b4db13ec344129e794c20ca41c1f4a67f&token=276961837&lang=zh_CN#rd
總結
以上是生活随笔為你收集整理的易基因 | 文献速递:RRBS方法绘制1538例乳腺癌甲基化图谱并预测癌症发生/预后的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 兴趣爱好选择
- 下一篇: 4种超好用的PS调色小技巧,知道的人不多