日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 前端技术 > HTML >内容正文

HTML

基因组浏览器使用 (EPGG)

發(fā)布時(shí)間:2025/3/15 HTML 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 基因组浏览器使用 (EPGG) 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

基因組瀏覽器是高通量測(cè)序分析的一個(gè)重要的可視化工具。相比于最終提供的表格,基因組瀏覽器可以提供更多的信息,如直觀展示突變位點(diǎn)、查看有無(wú)新轉(zhuǎn)錄本或新的可變剪接形式、查看peak的可信度、上下游基因、區(qū)域保守性、重復(fù)元件、蛋白結(jié)合motif等。

我們前面有測(cè)序數(shù)據(jù)可視化列舉了4個(gè)常用的高通量數(shù)據(jù)可視化工具,詳細(xì)介紹了IGV基因組瀏覽器可視化高通量測(cè)序數(shù)據(jù)和UCSC 基因組瀏覽器的安裝使用。

最近幾次將以華盛頓大學(xué)(DC)開(kāi)發(fā)的EPGG基因組瀏覽器為主要工具 (目前主流瀏覽器之一,不同的功能更新分別發(fā)表于NBT, Nature method等雜志),介紹下基因組瀏覽器的基本展示內(nèi)容、各部分含義、使用方式等。

基因組瀏覽器都可以按照位置基因名字搜索,可進(jìn)行局部放大和縮小。雖然每個(gè)軟件略有不同,但基本操作是通用的。點(diǎn)一點(diǎn),拽一拽,就都能用了。初次接觸一個(gè)軟件,多一點(diǎn)耐心,多一點(diǎn)操作,其實(shí)沒(méi)那么難。

基因信息展示包含基因的轉(zhuǎn)錄方向信息 (箭頭),基因結(jié)構(gòu)信息 (CDS, UTR, intron),基因功能描述信息等。方向信息對(duì)我們識(shí)別轉(zhuǎn)錄起始位點(diǎn)啟動(dòng)子區(qū)域和啟動(dòng)子上的ChIP peak至關(guān)重要。

另外還有個(gè)功能,基因只在基因組占1%,瀏覽起來(lái)不方便,Juxtapose模式可以只顯示基因區(qū),其它區(qū)域隱藏,這樣截圖或?yàn)g覽起來(lái)都更方便。

重復(fù)元件是我們做分析時(shí)需要關(guān)注的一個(gè)點(diǎn),最近Cell文章發(fā)現(xiàn) LINE元件 (A LINE-1-Nucleolin Patnership Regulates Early Development and ESC Identity)是胚胎發(fā)育的關(guān)鍵。如果我們的數(shù)據(jù)能在某個(gè)重復(fù)元件上有特殊分布,也可能催生重要發(fā)現(xiàn)呢。

“峰圖”是最常見(jiàn)的展示形式,reads的分布有高有低,在基因組上形成層戀疊嶂的山峰狀。峰頂表示對(duì)應(yīng)區(qū)域的表達(dá)、修飾或結(jié)合比較高。

除了峰形圖,也可以展示熱圖、線圖等。

數(shù)值Track支持的數(shù)據(jù)一般是bigWig格式,在不同瀏覽器之間通用。不同Track之間比較時(shí)需要先對(duì)數(shù)據(jù)做標(biāo)準(zhǔn)化,也需要設(shè)置同等大小的Y軸。數(shù)據(jù)可以進(jìn)行一定程度的擬合,使得結(jié)果更清晰 (圖中的Smooth window)。

這個(gè)線圖常用于比較富集樣品和對(duì)照樣品,或比較不同樣品之間的表達(dá)量高低等。把2個(gè)Track放到一起展示,高低立見(jiàn)。UCSC genome browser也有類似功能,而且展示效果更好,我們前面也已提過(guò)。

EPGG特有的甲基化數(shù)據(jù)展示,給定每個(gè)位點(diǎn)測(cè)序深度,CG甲基化比例,CHH,CHG甲基化比例等。還可以在線過(guò)濾,篩選不同支持reads數(shù)的甲基化位點(diǎn),更有動(dòng)態(tài)性。是甲基化分析的必備神器。

染色體的三維結(jié)構(gòu)研究越來(lái)越多,用途也越來(lái)越大。關(guān)聯(lián)SNP位點(diǎn)的功能,尋找enhancer的靶基因,基因組區(qū)域互作,都可以通過(guò)Hi-C數(shù)據(jù)提供更多支持信息。EPGG可以用互作熱圖或loop連線兩種方式展示區(qū)域之間的互作。

互作熱圖的識(shí)別方式是:如果要看位點(diǎn)A和位點(diǎn)B之間是否有互作,只需在正負(fù)45度方向畫一條線,查看線是否有交點(diǎn)和交點(diǎn)處顏色強(qiáng)弱即可判斷。

還有圈圖形式,從宏觀展示某個(gè)位點(diǎn)與基因組其它區(qū)域的互作。

SNP位點(diǎn)展示及連鎖不平衡展示,這也是EPGG的特有功能。可視化與Hi-C染色體互作類似。

下一步將講一下EPGG支持的物種,自帶數(shù)據(jù)和分析功能,以更方便使用。

EPGG支持的物種有人、小鼠、大鼠、猴子、豬、狗、猩猩、雞、斑馬魚、果蠅、線蟲、擬南芥、玉米、大豆、白菜、酵母等,也可以把自己的基因組整理成所需要的格式,導(dǎo)入EPGG使用。

模式生物有比較多的高通量測(cè)序研究的大項(xiàng)目,如TCGA,Roadmap,ENCODE等和染色體三維結(jié)構(gòu)或互作 Hi-C、ChIA-PET研究等公共數(shù)據(jù),可以直接點(diǎn)擊Load加載,然后再選擇關(guān)注的樣品或數(shù)據(jù)類型,導(dǎo)入瀏覽器查看。

加載好,Track選擇界面如下,可以點(diǎn)擊+進(jìn)一步展開(kāi),選擇對(duì)應(yīng)數(shù)據(jù)。

更多Track操作見(jiàn)下圖,也可以導(dǎo)入自己的Track (小文件直接上傳,大文件提供可訪問(wèn)的鏈接)。

文件上傳界面如下:

Track多了,分組就是問(wèn)題。EPGG提供右側(cè)的Metadata colormap,用不同的顏色塊區(qū)分樣品和測(cè)序類型等,鼠標(biāo)懸浮會(huì)有文字提示,是很方便的功能。

看到需要的結(jié)果,可以存儲(chǔ)下來(lái),放到文章的圖中。

也可以分享給老師、同學(xué)、合作者們。

EPGG還提供了很多實(shí)用的分析功能,如下圖:

同時(shí)展示多個(gè)基因在多個(gè)樣品的表達(dá)或修飾狀態(tài)

基因組瀏覽器分成2個(gè)panel,對(duì)比展示區(qū)域。類似于基因集展示,但更靈活。

只展示基因區(qū),移除基因間區(qū),更方便瀏覽。

染色體范圍的Track分布。

同源基因、同源區(qū)域展示,兩物種共線性基因組聯(lián)動(dòng)。

兩個(gè)數(shù)值Track在給定區(qū)域的比較,比如看啟動(dòng)子區(qū)H3K4me1和K3K27me3的結(jié)合,識(shí)別Bivalent promoter

TSS上下游區(qū)域H3K4me1, H3K27me3等修飾或TF結(jié)合圖譜繪制

Roadmap數(shù)據(jù)專用展示。

訪問(wèn)鏈接:http://epigenomegateway.wustl.edu/browser/

生物信息博客 http://www.blog.genesino.com

總結(jié)

以上是生活随笔為你收集整理的基因组浏览器使用 (EPGG)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。