Nat Methods | 王艇/李道丰实验室扩展WashU Epigenome Browser的3D基因组可视化功能
三維?(3D)?基因組結(jié)構(gòu)對(duì)于基因調(diào)控和細(xì)胞功能至關(guān)重要。基于染色體構(gòu)象捕獲(chromosome conformation capture)的高通量技術(shù)已被廣泛用于研究全基因組染色體的物理相互作用。這些交互作用一般用二維熱圖?(heatmap)或裝飾基因組特征的交互網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)可視化。此外,一些使用基于模型的交互數(shù)據(jù)的計(jì)算方法已經(jīng)開(kāi)發(fā)出來(lái),例如約束物理模型(constrained physical models)、聚合物模型(polymer models)和基于群體的分析(population-based analysis),用來(lái)預(yù)測(cè)染色體的物理三維結(jié)構(gòu)。大型數(shù)據(jù)聯(lián)盟,例如 ENCODE、Roadmap 和 4D Nucleome,已經(jīng)在眾多細(xì)胞類(lèi)型和組織中生成了數(shù)以萬(wàn)計(jì)的轉(zhuǎn)錄因子結(jié)合位點(diǎn)和表觀遺傳標(biāo)記的全基因組數(shù)據(jù)集。生物學(xué)家希望直觀地探索這些全基因組圖譜和 3D 基因組結(jié)構(gòu)之間的聯(lián)系,這將有助于產(chǎn)生和檢驗(yàn)各種科學(xué)假設(shè)。這些需求對(duì)傳統(tǒng)的基因組瀏覽器提出了挑戰(zhàn),因?yàn)榇蠖鄶?shù)基因組數(shù)據(jù)在一維線性基因組坐標(biāo)中進(jìn)行可視化。王艇課題組在2011年開(kāi)發(fā)了華大表觀基因組瀏覽器(WashU Epigenome Browser),作為一種交互式工具,用于在網(wǎng)絡(luò)瀏覽器中探索基因組數(shù)據(jù)。經(jīng)過(guò)十余年的加工,拓展和創(chuàng)新,華大表觀基因組瀏覽器已成為基因組學(xué)研究的重要工具,和UCSC Genome Browser,Ensembl Genome Browser 并為行業(yè)標(biāo)桿。WashU Browser 團(tuán)隊(duì)近期擴(kuò)展了WashU Browser的功能,可以讓研究人員在單個(gè)網(wǎng)頁(yè)上直觀地探索 1D、2D 和 3D 基因組數(shù)據(jù)。主要的創(chuàng)新是將線性基因組坐標(biāo)關(guān)聯(lián)到多分辨率的 染色體3D 模型上。
2022年7月21日,圣路易斯華盛頓大學(xué)遺傳系王艇教授和李道豐教授團(tuán)隊(duì)在Nature Methods發(fā)表了題為Exploring genomic data coupled with 3D chromatin structures using the WashU Epigenome Browser的文章,介紹了基于WashU Epigenome Browser擴(kuò)展的3D基因組可視化功能(Nat Methods | 馬堅(jiān)實(shí)驗(yàn)室開(kāi)發(fā)用于多模態(tài)三維基因組數(shù)據(jù)可視化平臺(tái))。
WashU Browser團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)新的文件格式叫做g3d,并且提供了一個(gè)基于Python的工具g3dtools(https://github.com/lidaof/g3d)用來(lái)生成這種新格式的數(shù)據(jù)。這個(gè)二進(jìn)制的格式主要的優(yōu)點(diǎn)是對(duì)于網(wǎng)絡(luò)請(qǐng)求十分友好,設(shè)計(jì)類(lèi)似于UCSC的Bigwig格式,這個(gè)格式可以用于存儲(chǔ)多個(gè)分辨率或多個(gè)細(xì)胞的3D數(shù)據(jù)。
秉承WashU Browser一貫關(guān)注易用性和實(shí)用性的傳統(tǒng),生成 的g3d文件可以放在網(wǎng)站上提供一個(gè)web URL給Browser或者直接從本地上傳到Browser進(jìn)行可視化。提交g3d文件后,Browser會(huì)打開(kāi)一個(gè)新的面板(panel)用來(lái)展示3D結(jié)構(gòu),同時(shí)主面板的常規(guī)基因組瀏覽器可以用來(lái)與3D顯示模塊進(jìn)行交互(如圖1所示)。基因,Hi-C圖的loop都可用在3D結(jié)構(gòu)中進(jìn)行標(biāo)記高亮。數(shù)值型數(shù)據(jù)例如bigwig可以用來(lái)給3D結(jié)構(gòu)調(diào)色,根據(jù)數(shù)據(jù)值的高低3D結(jié)構(gòu)會(huì)呈現(xiàn)不同的顏色梯度。注釋型數(shù)據(jù)例如chromHMM,compartment也可以將3D結(jié)構(gòu)的不同區(qū)域調(diào)成相應(yīng)的顏色。3D 模塊使查看染色質(zhì)環(huán)(chromatin loop)和拓?fù)湎嚓P(guān)域?(Topologically associated domains, TADs)變得直觀。
WashU Browser團(tuán)隊(duì)從發(fā)表的文獻(xiàn)中搜集了11045個(gè)3D模型,大多數(shù)模型都是從單細(xì)胞數(shù)據(jù)中研究得來(lái)。研究人員也可以上傳自己的3D結(jié)構(gòu)與已有數(shù)據(jù)進(jìn)行比較。基因組技術(shù)和計(jì)算算法的最新進(jìn)展為探測(cè)染色質(zhì)相互作用和生成 3D 模型提供了前所未有的機(jī)會(huì)。這些模型不僅有助于研究 3D 基因組的形成和功能,而且還提供了不同的范例來(lái)顯示基因組數(shù)據(jù)并與之交互。傳統(tǒng)的基因組瀏覽器將基因組數(shù)據(jù)錨定在一維線性軸上,模擬解開(kāi)和拉直基因組 DNA 的過(guò)程。這個(gè)過(guò)程使覆蓋基因組數(shù)據(jù)變得方便和直接;然而它破壞了染色質(zhì)的空間結(jié)構(gòu)。研究人員通過(guò)將線性坐標(biāo)關(guān)聯(lián)3D 模型來(lái)維持基因組 DNA 的 3D 結(jié)構(gòu)。該方法將線性基因組與 3D 空間位置,以及相應(yīng)的可視化工具進(jìn)行無(wú)縫整合。這使研究人員可以直觀地探索 3D 特征,例如loop和 TADs; 在 3D 基因組坐標(biāo)上可視化所有基因組數(shù)據(jù);并探索 3D 基因組結(jié)構(gòu)的動(dòng)態(tài)性。
王艇教授是美國(guó)圣路易斯華盛頓大學(xué)遺傳系Sanford and Karen Loewentheil Distinguished Professor of Medicine,同時(shí)也是計(jì)算機(jī)科學(xué)與工程的教授,兼任McDonnell Genome Institute的科研主任。王艇教授長(zhǎng)期領(lǐng)導(dǎo)大型國(guó)際項(xiàng)目例如ENCODE,Roadmap,4DN,TaRGET以及當(dāng)前最新的人類(lèi)泛基因組計(jì)劃(Human Pangenome Project)和IGVF(Impact of Genetics Variation on Function),funding多多。李道豐博士在王艇實(shí)驗(yàn)室經(jīng)過(guò)博士后深造后晉升教授,長(zhǎng)期主持WashU Browser 項(xiàng)目。Browser團(tuán)隊(duì)目前正在招人,歡迎感興趣的老師和同學(xué)聯(lián)系(http://wang.wustl.edu/)。
測(cè)試數(shù)據(jù)及快速指南:https://github.com/lidaof/eg-3d-demo
詳細(xì)文檔:https://eg.readthedocs.io/en/latest/3d.html
視頻教程(B站):https://www.bilibili.com/medialist/play/438038855?from=space&business=space_series&business_id=608067&desc=1&spm_id_from=333.999.0.0
原文鏈接:
https://www.nature.com/articles/s41592-022-01550-y
制版人:十一? 責(zé)編 | 兮? 來(lái)源:BioArt
IGV基因組瀏覽器可視化高通量測(cè)序數(shù)據(jù)
高通量數(shù)據(jù)分析必備-基因組瀏覽器使用介紹 - 1
高通量數(shù)據(jù)分析必備-基因組瀏覽器使用介紹 - 2
高通量數(shù)據(jù)分析必備-基因組瀏覽器使用介紹 - 3
往期精品(點(diǎn)擊圖片直達(dá)文字對(duì)應(yīng)教程)
機(jī)器學(xué)習(xí)
后臺(tái)回復(fù)“生信寶典福利第一波”或點(diǎn)擊閱讀原文獲取教程合集
總結(jié)
以上是生活随笔為你收集整理的Nat Methods | 王艇/李道丰实验室扩展WashU Epigenome Browser的3D基因组可视化功能的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 海贼王结局
- 下一篇: java svg png_java ba