iMeta | 华南农大陈程杰/夏瑞等发布TBtools构造Circos图的简单方法
點(diǎn)擊藍(lán)字 關(guān)注我們
定制Circos圖:使用TBtools,從數(shù)據(jù)準(zhǔn)備到可視化
https://onlinelibrary.wiley.com/doi/full/10.1002/imt2.35
●2022年7月4日,華南農(nóng)業(yè)大學(xué)夏瑞團(tuán)隊(duì)在iMeta在線發(fā)表了題為“A painless way to customize Circos plot: From data preparation to visualization using TBtools”的文章。
●?在該文章中,作者在TBtools中開發(fā)了“Advanced Circos”功能,提供構(gòu)造Circos圖的簡單方法。“Advanced Circos”功能提供了一個(gè)用戶友好界面,用于定制參數(shù)設(shè)置,并可用于可視化各種基因組水平數(shù)據(jù),如基因組關(guān)聯(lián)信息、比對(duì)數(shù)據(jù)、基因密度和QTL位置。
●? 第一作者:陳程杰
●? 通訊作者:夏瑞?(rxia@scau.edu.cn)
●??合作作者:吳亞
摘? ?要
Circos圖使科學(xué)家能夠輕松地在全基因組尺度上探索生物大數(shù)據(jù),但繁瑣的輸入數(shù)據(jù)準(zhǔn)備和復(fù)雜的參數(shù)配置限制了其應(yīng)用。我們?cè)赥Btools中開發(fā)了“Advanced Circos”功能,提供構(gòu)造Circos圖的簡單方法。作為一個(gè)開箱即用的軟件,TBtools集成了系列便于輸入數(shù)據(jù)準(zhǔn)備的功能。“Advanced Circos”功能提供了一個(gè)用戶友好界面,用于定制參數(shù)設(shè)置,并可用于可視化各種基因組水平數(shù)據(jù),如基因組關(guān)聯(lián)信息、比對(duì)數(shù)據(jù)、基因密度和QTL位置。本文介紹了“Advance Circos”的主要特點(diǎn)和上游數(shù)據(jù)準(zhǔn)備方法,旨在讓更多用戶能夠使用Circos圖進(jìn)行基因組大數(shù)據(jù)探索。
關(guān)鍵詞:Circos, TBtools, 全基因組水平, 數(shù)據(jù)可視化
亮? ?點(diǎn)
●?全基因組尺度數(shù)據(jù)可視化的開箱即用解決方案
●?Circos圖繪制與參數(shù)定制的手把手教程
●?可重現(xiàn)的項(xiàng)目管理
視頻教程
Bilibili:https://www.bilibili.com/video/BV1iT411u7y1/??
Youtube:https://youtu.be/ERWo7KhLQs0
中文翻譯、PPT、中/英文視頻解讀等擴(kuò)展資料下載
請(qǐng)?jiān)L問期刊官網(wǎng):http://www.imeta.science/
全文解讀
開發(fā)動(dòng)機(jī)
隨著測(cè)序技術(shù)的快速發(fā)展和數(shù)據(jù)分析技術(shù)的進(jìn)步,越來越多的生物基因組序列被解碼。隨之而來,生物學(xué)研究進(jìn)入了后基因組時(shí)代。這要求我們從全基因組范圍內(nèi)更頻繁地探索大型生物數(shù)據(jù)。2009年,Krzywinski提出了Circos圖可視化模式。這是一種可視化基因組大數(shù)據(jù)的強(qiáng)大方法[1]。自那時(shí)以來,Circos已被用于許多比較基因組學(xué)分析,但由于其在繪制配置和程序使用方面的復(fù)雜性,其效用尚未完全釋放。雖然目前已有幾種用于快速繪制Circos圖的工具[1-7],但其間仍有地方值得優(yōu)化:(1)多數(shù)Circos繪制工具的安裝復(fù)雜,或需要在命令行環(huán)境下工作,要求用戶具備較高水平的計(jì)算機(jī)技能,如Perl-Circos;(2)Circos圖繪制往往需要用戶使用其他各類軟件或自行編寫腳本整理數(shù)據(jù);(3)繪制圖稿不支持交互式編輯、直接重繪和中間工程文件的協(xié)作共享能力有限。
因此,我們?cè)赥Btools [8]中開發(fā)了“Advanced Circos”功能,旨在提供創(chuàng)建Circos圖的最簡單、最方便的方法。用戶需要做的是按照TBtools圖形界面中的簡單提示來組織以制表符分隔的輸入文件。所有繪圖參數(shù)可以交互調(diào)整,Circos圖可以立即生成和刷新。用戶可以保存工作項(xiàng)目以供進(jìn)一步修改、復(fù)制和共享。此外,TBtools作為一個(gè)多功能工具包,具有一系列文本處理和數(shù)據(jù)整理功能,幫助用戶輕松快速地準(zhǔn)備輸入數(shù)據(jù),為Circos繪圖創(chuàng)建提供一站式解決方案。
數(shù)據(jù)類別
TBtools中的“Advanced Circos”功能支持可視化多組連續(xù)或離散數(shù)據(jù)。通常,這些數(shù)據(jù)類型可分為四大類,如圖1所示:
圖1. 不同數(shù)據(jù)類型在TBtools的“Advanced Circos”的可視化模式
(A)染色體骨架;(B)熱圖;(C)條形圖;(D)折線圖;(E)點(diǎn)圖;(F)三角形;(G)箭頭;(H)bézier曲線;(I)區(qū)塊;(J)文本標(biāo)簽。與每個(gè)標(biāo)簽字符相鄰的是其相應(yīng)輸入數(shù)據(jù)格式示例。灰色背景的文本表示相應(yīng)的列是可選的。
第一類是染色體骨架(圖1A),呈現(xiàn)特定染色體或其他基因組序列(如支架或重疊群)。它是Circos圖的主干,是必需的輸入數(shù)據(jù)。默認(rèn)輸入數(shù)據(jù)由兩個(gè)必填列,一個(gè)是染色體ID,另一個(gè)是染色體長度信息。用戶也可以在第三列增加可選RGB代碼,以指定染色體骨架的顏色。
第二類是特定染色體區(qū)域的標(biāo)記數(shù)據(jù)(圖1J),可用于標(biāo)記特定區(qū)間,如基因或QTL(數(shù)量性狀基因座)位置。相應(yīng)的輸入是一個(gè)以制表符分隔的文件,其中包含四個(gè)必填列和一個(gè)可選列:染色體ID、區(qū)域標(biāo)記標(biāo)簽、起始坐標(biāo)、結(jié)束坐標(biāo)和RGB代碼(可選)。
第三類顯示染色體區(qū)域的關(guān)聯(lián)信息(圖1H),通常用于顯示同源區(qū)域或染色體相互作用關(guān)系等。這類數(shù)據(jù)通常放在Circos圖的最內(nèi)層。輸入文件由六個(gè)必填列和一個(gè)可選列組成,以制表符分隔,分別是染色體ID、起始坐標(biāo)、終止坐標(biāo)、染色體ID、起始坐標(biāo)、終止坐標(biāo)和RGB代碼(可選)。
第四類是染色體區(qū)域統(tǒng)計(jì)數(shù)據(jù)(圖1B-G,1I),可以以各種方式顯示,包括連續(xù)數(shù)據(jù)(以熱圖、條形圖、折線圖或點(diǎn)圖顯示)和離散數(shù)據(jù)(以三角形、箭頭或平鋪/矩形顯示)。對(duì)于連續(xù)數(shù)據(jù),輸入文件的格式為“染色體ID、起始坐標(biāo)、結(jié)束坐標(biāo)和以數(shù)字標(biāo)示的值”(圖1B-E);對(duì)于離散數(shù)據(jù),輸入文件格式為“染色體ID、起始坐標(biāo)、結(jié)束坐標(biāo)和RGB代碼”(圖1F、1G、1I)。對(duì)于箭頭符號(hào)(圖1G),當(dāng)起始坐標(biāo)大于結(jié)束坐標(biāo)時(shí),其方向相反。通過調(diào)整繪圖跨度,可以堆疊Circos繪圖上的不同軌跡,以實(shí)現(xiàn)各種可視化類型組合,如圖1I和圖6所示。矩形/平鋪軌跡用于突出顯示染色體部分區(qū)域。
圖形界面
●??主界面
打開TBtools->“Graphics”->“Advanced Circos”,在彈出的界面(圖2A-E)中,有三個(gè)輸入文件字段和兩個(gè)功能按鈕。
1、Chr長度文件(必填);
2、基因組特征信息(可選);
3、關(guān)聯(lián)區(qū)域信息(可選);
4. “Load Project…” 按鈕加載預(yù)先存在的Circos項(xiàng)目;
5、“Show My Circos Plot!” 按鈕生成基因組骨架圖。
圖2.? Advanced Circos的主界面和參數(shù)面板
(A)-(C)輸入文件面板;(D)現(xiàn)有項(xiàng)目恢復(fù)按鈕;(E)按鈕點(diǎn)擊生成基因組骨架圖;(F)Cirocs繪圖的全局參數(shù)設(shè)置;(G)用于導(dǎo)出繪圖或保存項(xiàng)目的按鈕;(H)每個(gè)染色體區(qū)域統(tǒng)計(jì)可視化的參數(shù)設(shè)置。
●??高級(jí)參數(shù)設(shè)置
通過單擊“Show Control Dialog”按鈕,可以打開高級(jí)Circos控制面板。參數(shù)設(shè)置面板可分為三個(gè)主要部分(圖2F-G)。
1、位于界面底部的保存按鈕(圖2G)。“Save Graph”按鈕用于導(dǎo)出當(dāng)前繪圖,支持位圖和矢量格式;“Save Curr. Project”按鈕可用于保存正在進(jìn)行的項(xiàng)目,該項(xiàng)目可通過上述“Load Project…”恢復(fù),也可以直接與其他用戶共享或直接在其他設(shè)備上復(fù)現(xiàn);
2、位于界面左側(cè)的全局參數(shù)設(shè)置(圖2F)。這些設(shè)置用于控制總體繪圖細(xì)節(jié),詳細(xì)分為幾個(gè)部分:圖形設(shè)置、顏色欄、顏色標(biāo)簽、顏色記號(hào)、關(guān)聯(lián)信息、特征標(biāo)簽、熱圖顏色比例。而頂部的“Refresh Graph”按鈕用于應(yīng)用調(diào)整后的參數(shù)并刷新當(dāng)前繪圖。
3、位于界面右側(cè)的單道圖形控制參數(shù)(圖2H)。它們用于控制染色體區(qū)域統(tǒng)計(jì)信息的可視化細(xì)節(jié),染色體區(qū)域統(tǒng)計(jì)信息也分為幾個(gè)部分,包括BIN設(shè)置、顏色設(shè)置、Bar設(shè)置和線條設(shè)置。單擊“添加”按鈕,將生成圖形軌道。對(duì)于每個(gè)參數(shù)的詳細(xì)效果,建議用戶使用示例數(shù)據(jù)自行探索(見支持?jǐn)?shù)據(jù)1)。
●??案例演示
Advanced Circos是TBtools的內(nèi)置功能之一,它與一系列可用于輸入數(shù)據(jù)準(zhǔn)備的功能集成在一起。在本節(jié)中,我們將逐步演示如何使用TBtools的Advanced Circos功能從常見的生物大數(shù)據(jù)出發(fā),到Circos圖生成。
(a) 染色體骨架文件制備
染色體骨架是Circos圖的主干。可以使用TBtools中的“Fasta Stat”功能從基因組序列文件中獲取有關(guān)基因組的信息(圖S1)。
功能位置:“Sequence Toolkit”->“Fasta Tools”->“Fasta Stats”;
輸入文件:“Arabidopsis_ thaliana.genome.fna”
輸出文件:“Arabidopsis_ thaliana.genome.fna.ChrLen.txt”
操作步驟:
1、轉(zhuǎn)到“Fasta Stats”;
2、設(shè)置輸入文件和輸出文件;
3、勾選“僅保留序列長度”;
4、點(diǎn)擊“開始”按鈕,所需信息將保存到輸出文件
(“Arabidopsis_thaliana.genome.fna.ChrLen.txt”)。
注:演示數(shù)據(jù)的文件名為斜體
輸出文件(“Arabidopsis_thaliana.genome.fna.ChrLen.txt”)包含每個(gè)染色體的序列長度信息。用戶可以手動(dòng)編輯。例如,我們?cè)谶@里刪除了兩條質(zhì)粒染色體的長度信息。
Chr1?????? 30427671
Chr2?????? 19698289
Chr3?????? 23459830
Chr4?????? 18585056
Chr5?????? 26975502
ChrM????? 366924
ChrC????? 154478
只需將染色體長度信息的結(jié)果文件拖放到Advanced Circos(圖2A)的第一個(gè)字段中,按“Show My Circos Plot!”按鈕,立即生成染色體骨架的Circos圖(圖3A)。
圖3:Advanced Circos的染色體骨架、區(qū)域標(biāo)記和區(qū)域關(guān)聯(lián)數(shù)據(jù)可視化
(A)基本染色體骨架;(B)不同顏色著色的染色體骨架;(C)染色體骨架上的基因位置可視化;(D)染色體間的染色體區(qū)域關(guān)聯(lián)信息可視化。
通過向每行染色體長度信息添加RGB顏色代碼,可以對(duì)每個(gè)染色體進(jìn)行不同著色。用戶還可以使用“Discrete Color Scheme Generator”自動(dòng)生成一系列顏色(圖S2)
功能位置:“圖形”->“調(diào)色板”->“離散配色方案生成器”;
輸入文件:“Arabidopsis_thaliana.genome.fna.ChrLen.txt”
輸出文件:“Arabidopsis_thaliana.genome.fna.ChrLen.withColor.txt”
操作步驟:
1、切換到“離散顏色方案生成器”;
2、設(shè)置輸入文件和輸出文件;
3、點(diǎn)擊“開始”按鈕,RGB色碼將添加到輸出文件(“Arabidopsis_thaliana.genome.fna.ChrLen.withColor.txt”)。
輸出文件中的內(nèi)容如下所示:
Chr1?????? 30427671????? 11,249,4
Chr2?????? 19698289????? 241,193,242
Chr3?????? 23459830????? 208,201,119
Chr4?????? 18585056????? 152,162,81
Chr5?????? 26975502????? 212,178,129
在Advanced Circos中用該文件替換染色體骨架信息,將生成彩色骨架圖(圖3B)。
(b) 添加基因組標(biāo)簽信息
在許多情況下,我們希望在染色體上標(biāo)記某些基因組特征,例如基因、QTL和TAD(拓?fù)潢P(guān)聯(lián)域)。例如,要突出顯示某些基因,用戶需要首先獲得每個(gè)基因的位置信息。TBtools的“GXF基因位置和信息提取”功能可用于獲得特定基因的相應(yīng)基因組區(qū)域(圖S3)。
功能位置:“Sequence Toolkit” -> “GFF3/GTF Manipulate” -> “GXF Gene Position & Info Extract”
輸入文件:Arabidopsis_thaliana.genome.gff3
輸出文件:Arabidopsis_thaliana.genome.gff3.CDS.Info.xls
操作步驟:
1、設(shè)置輸入、輸出文件
2、點(diǎn)擊“Start”按鈕
輸出文件包含擬南芥所有CDS的位置信息。用戶可以使用Excel或其他文本編輯軟件從該表中選擇感興趣的基因信息。在這里,我們使用TBtools中的“Table Row Manipulate”功能,挑出了擬南芥中ARF家族的基因(必須提前準(zhǔn)備ARF基因的ID列表)。
功能位置:“Others” -> “Table/Text File Manipulator” -> “Table Row Manipulate”
輸入文件: Arabidopsis_thaliana.genome.gff3.CDS.Info.xls
輸入ID列表: ARF.Family.IDs.txt
輸出文件: Arabidopsis_thaliana.genome.ARF.Pos.Info.xls
操作步驟:
1、設(shè)置輸入文件,選擇第一列進(jìn)行處理;
2、設(shè)置輸入AtARF ID列表;
3、設(shè)置輸出文件;
4、點(diǎn)擊“Start”按鈕。
可以對(duì)結(jié)果文件進(jìn)行簡單修改,即只保留前四列,具體文件信息如下:
Chr1 AT1G19220.1 6628068 6633087
Chr1 AT1G19850.1 6886879 6891374
Chr1 AT1G30330.1 10685822 10690838
...
此文件可直接用于Advanced Circos可視化。用戶還可以為每個(gè)基因附加RGB代碼,以呈現(xiàn)不同的文本顏色。如果特征標(biāo)簽在繪圖中重疊,可以調(diào)整“全局參數(shù)設(shè)置”中“特征標(biāo)簽”下的“重疊權(quán)重”值,如設(shè)置為“-4”或更大的數(shù)字,進(jìn)而優(yōu)化文本間距(圖3C)
(c) 基因組區(qū)域關(guān)聯(lián)圖
染色體序列在內(nèi)部或染色體間是相互關(guān)聯(lián)的,例如序列同源、染色體相互作用以及基因相互調(diào)節(jié)。Circos圖通常用于顯示全基因組復(fù)制、大片段易位和串聯(lián)重復(fù)的基因組特征。用戶只需使用TBtools中的幾個(gè)函數(shù),即可準(zhǔn)備相關(guān)的輸入文件,例如,“One Step MCScanX”[9](圖S3)。
功能位置:“Graphics” -> “Comparative Genomics” -> “One Step MCScanX”
輸入的基因組序列信息:Arabidopsis_thaliana.genome.fna
輸入的基因結(jié)構(gòu)注釋信息: Arabidopsis_thaliana.genome.gff3
輸出文件夾: Synteny Result
在輸出目錄中,將生成一個(gè)后綴為“*.geneLinkedRegion.tab.xls”的文件。它可以用于Advanced Circos可視化。該文件的最后一列(第8列)包含有關(guān)同源基因?qū)Φ男畔?#xff0c;Advanced Circos將忽略這些信息。盡管如此,用戶可以選擇感興趣的關(guān)聯(lián)間隔,調(diào)整RGB代碼,并將這些行移動(dòng)到輸入文件的頭部以突出顯示這些區(qū)域。示例文件,如下所示。結(jié)果圖將類似于圖3D。
Chr2?????? 19105112????? 19108331????? Chr3?????? 22887889????? 22891435????? 255,0,0?????? AT2G46530.3.match.AT3G61830.1
Chr2?????? 19105112????? 19108331????? Chr4?????? 12451277????? 12455014????? 255,0,0?????? AT2G46530.3.match.AT4G23980.1
Chr3?????? 22887889????? 22891435????? Chr4?????? 12451277????? 12455014????? 255,0,0?????? AT3G61830.1.match.AT4G23980.1
……
(d) 基因組數(shù)據(jù)可視化
GC含量 / GCskew / 未知堿基
核酸組成是基因組的一個(gè)基本特征。例如,GC含量與編碼基因和功能DNA元素的密度相關(guān);GC-skew是一種度量鳥嘌呤和胞嘧啶鏈偏好的指數(shù),可以幫助檢測(cè)細(xì)菌環(huán)形染色體中的DNA復(fù)制起始位點(diǎn)。未知堿基(N)分布可從一定程度上顯示基因組組裝質(zhì)量。TBtools中的“Fasta Window Stat”功能可用于快速將基因組序列文件中的GC含量、GC偏斜和N比率制成表格。
功能位置:“Sequence Toolkit”->“Fasta Tools”->“Fasta Window Stat”
輸入基因組序列文件:Arabidopsis_thaliana.genome.fna
輸出文件前綴:Arabidopsis_thaliana.genome.Window.Stat
將生成三個(gè)前綴相同的文件。他們是
“Arabidopsis_thaliana.genome.Window.Stat.GCratio”, “Arabidopsis_thaliana.genome.Window.Stat.GCskew”, “Arabidopsis_thaliana.genome.Window.Stat.Nratio”
這三個(gè)輸出文件都適用于Advanced Circos可視化。這里,我們使用N比率統(tǒng)計(jì)文件作為第一個(gè)示例(圖4A)。
1、手動(dòng)刪除N比為0的行(可選);
2、如上所述加載染色體骨架信息后,點(diǎn)擊“Start”進(jìn)行可視化;
3、進(jìn)入?yún)?shù)控制界面(“Show Control Dialog”),點(diǎn)擊右側(cè)的“Add”按鈕,添加新的軌道;
4、設(shè)置N比率文件的輸入文件;
5、選擇軌道類型作為點(diǎn),然后單擊“Refresh Graph”(圖4B)。
請(qǐng)注意,我們已經(jīng)使用了滑動(dòng)窗口方法來計(jì)算N比率,因此“BIN Mode”可以設(shè)置為“None”。
圖4:使用不同的軌道類型查看連續(xù)數(shù)據(jù)
(A)軌道參數(shù)面板;(B)在點(diǎn)圖中查看的N比率情況;(C)GC偏斜度;(D)熱圖中的基因密度;(E)條形圖中的排序覆蓋率。
類似地,我們可以使用線條圖來可視化GC偏斜。GC偏移的計(jì)算以0為界,因此我們?cè)谟覀?cè)的行設(shè)置中將“Sep Line Value”設(shè)置為0,以實(shí)現(xiàn)正負(fù)偏移值的不同著色(圖4C)。
基因密度
基因組范圍內(nèi)的基因密度分布通常通過Circos圖進(jìn)行可視化。TBtools有一個(gè)方便的功能——“Gene Density Profile”,它允許用戶從基因結(jié)構(gòu)注釋文件中計(jì)算基因密度,通常為GFF3和GTF格式。
功能位置: “Sequence Toolkits” -> “GFF3/GTF Manipulate” -> “Gene Density Profile”
輸入文件: Arabidopsis_thaliana.genome.gff3
輸出文件: GeneDensity.profile
在“Control Dialog”面板中,單擊“Add”以獲得附加軌道,拖放基因密度信息文件(“GeneDensity.profile”),選擇熱圖模式,然后刷新繪圖(圖4D)。如果基因密度分布明顯有偏差,用戶可以在左下角面板的“Heat Color Scale”菜單中嘗試不同的顏色縮放模式,以獲得更好的視圖。每個(gè)熱圖軌道都會(huì)自動(dòng)觸發(fā)繪制顏色方案圖例,并且這些圖例可以輕松移動(dòng)。
測(cè)序數(shù)據(jù)覆蓋度分布
在許多情況下,除了基因組序列本身的特征外,我們還對(duì)查看實(shí)際NGS數(shù)據(jù)在基因組上的分布感興趣,例如,深度測(cè)序數(shù)據(jù)的覆蓋范圍。TBtools中的“SAM/BAM/CRAM BIN Cov”功能可用于根據(jù)映射工具生成的原始對(duì)齊文件(通常為SAM、BAM或CRAM格式)準(zhǔn)備輸入文件。
功能位置: “Others” -> “HTS Data” -> “SAM/BAM/CRAM BIN Cov”
輸入文件: SRR17382349_1.bam
輸出文件: SRR17382349_1.bam.BINStat.tab.xls
這里,我們選擇了條形圖來可視化覆蓋率數(shù)據(jù)。勾選“Color by Chr”,使條形圖的顏色與染色體的顏色一致。“Bar Fill”選項(xiàng)控制軌道的背景色,此處設(shè)置為灰色(圖4E)。
基因組變異數(shù)據(jù)
與比對(duì)文件(用于序列覆蓋)類似,在TBtools中,用戶還能夠處理基因組變異的數(shù)據(jù),例如,包含基因組序列變異信息的VCF文件。“VCF BIN Cov”功能可用于輸入準(zhǔn)備。
功能位置: “Others” -> “HTS Data” -> “VCF BIN Cov”
輸入文件: Est-1.qual50.filtered.direct.vcf.gz
輸出文件: Est-1.qual50.filtered.direct.vcf.BINCount.tab.xls
使用熱圖模式,可以全面查看染色體上序列變異的熱點(diǎn)區(qū)域。總體模式在很大程度上與上述基因密度分布互補(bǔ)。
QTLs/Arrow/TAD
上面使用的所有演示數(shù)據(jù)都是連續(xù)的基因組數(shù)據(jù),“Advanced Circos”還提供了顯示離散數(shù)據(jù)的各種模式。我們可以參考上述Tile track的格式要求組織QTL信息,例如:
Chr3 7842037 11192039 56,108,176,0.7 Blue Light
Chr5 2899846 8562462 56,108,176,0.7 Blue Light
Chr1 19672910 24443023 227,26,28,0.7 Red Light
Chr1 592464 24581765 255,255,179,0.7 White Light
Chr5 1507102 5275918 255,255,179,0.7 White Light
使用此數(shù)據(jù)作為輸入,并選擇“Tile”模式以顯示它(圖5A)。請(qǐng)注意,最后一列是可選的,它的存在將自動(dòng)觸發(fā)圖例生成。所有圖例都可以輕松移動(dòng)。此外,“Advanced Circos”還可用于可視化TAD(使用“三角形”模式)或帶方向基因區(qū)間(使用“箭頭”模式)(圖1)。
圖5: 用不同軌道類型表示的離散數(shù)據(jù)
(A)QTL的平鋪圖;(B)修改平鋪圖以突出感興趣的基因組間隔。
(e) 其他自定義選項(xiàng)
區(qū)間高亮
通過調(diào)整Tile軌道的繪制范圍(“平鋪”軌跡的“Start Pos”和“End Pos”),可以實(shí)現(xiàn)高亮區(qū)域功能。從圖5A開始,將“Start Pos”設(shè)置為90,“Bar Border”設(shè)置為“null”,并刷新圖像,我們將得到如圖5B所示的圖。
軌道重疊
按照區(qū)域突出顯示功能的相同邏輯,可以將不同的軌跡合并為一個(gè),這也可以通過調(diào)整每個(gè)軌跡的“Start Pos”和“End Pos”來實(shí)現(xiàn)。通過簡單地合并上述軌道,我們可以得到如圖6A。
圖6:Circos的重疊軌道
(A)從Circos圖的內(nèi)部到外部分別是:基因組區(qū)域關(guān)聯(lián)的Bézier曲面;N-比率分布的點(diǎn)圖;GCskew的線圖;基因密度分布的熱圖與GC比率變化的線圖重疊;測(cè)序覆蓋率條形圖;倒置的條形圖;基因家族的標(biāo)簽;(B)捋值的Circos
直線型還是環(huán)型?
Advanced Circos是基于我們一直在開發(fā)的TBtools強(qiáng)大的交互式繪圖引擎“JIGplot”開發(fā)的。因此,“Advanced Circos”具有坐標(biāo)切換(笛卡爾坐標(biāo)和極坐標(biāo)之間)和交互式分析的功能。通過取消選中“Circulized”復(fù)選框,我們將獲得捋值了的Circos圖,即“Straight”模式(圖6B)。此外,用戶可以輕松編輯繪圖中的每個(gè)元素,例如,旋轉(zhuǎn)元素和更改文本字體和顏色。
保存、共享和重新加載項(xiàng)目
在主繪圖面板中,單擊“Save Curr. Project”,將當(dāng)前繪圖數(shù)據(jù)和狀態(tài)保存到指定目錄。用戶可以隨時(shí)直接從Advanced Circos主界面重現(xiàn)保存的項(xiàng)目,做進(jìn)一步調(diào)整。此外,用戶只需打包目錄并將其發(fā)送給同事共享他們的Circos項(xiàng)目,或直接從其他設(shè)備工作。
結(jié)論
繁瑣的數(shù)據(jù)準(zhǔn)備、復(fù)雜的配置和大量的文本整理操作限制了Circos圖在科學(xué)研究中的使用。本文簡要介紹了TBtools中“Advanced Circos”繪圖功能和相應(yīng)參數(shù)接口,并詳細(xì)闡述了如何從常見的NGS數(shù)據(jù)出發(fā),使用“Advanced Circos”制作信息豐富的Circos圖。幾乎所有步驟都可以在TBtools中通過簡單的點(diǎn)擊輕松完成。我們預(yù)計(jì),本文中TBtools的“Advanced Circos”將使更多的研究人員能夠享受Circos圖在探索大型生物數(shù)據(jù)方面的優(yōu)勢(shì)。
致謝
本研究由嶺南現(xiàn)代農(nóng)業(yè)廣東實(shí)驗(yàn)室(項(xiàng)目編號(hào):NZ2021007)、國家自然科學(xué)基金(32102320)和廣東省專項(xiàng)支持計(jì)劃(2019TX05N193)資助。我們感謝華西醫(yī)院的于浩鵬博士和中國熱帶農(nóng)業(yè)科學(xué)院的馮筠庭博士就改進(jìn)TBtools的Advanced Circos功能提出的建設(shè)性建議。我們非常感謝40000多名TBtools用戶,尤其是30多名高級(jí)用戶的良好建議。
利益沖突
作者聲明沒有相互競爭的利益
作者貢獻(xiàn)
Chengjie Chen和Rui Xia構(gòu)思了該項(xiàng)目;Chengjie Chen和Rui Xia設(shè)計(jì)了工具箱的功能;Chengjie Chen執(zhí)行了所有Java編碼。Ya Wu測(cè)試了這些功能,并幫助編寫了教程手冊(cè)和圖表。Chengjie Chen和Rui Xia設(shè)計(jì)了這些圖形并撰寫了手稿。所有作者都閱讀并通過了最終手稿。
數(shù)據(jù)可用性
所有演示數(shù)據(jù)和TBtools的相應(yīng)版本可在https://tbtools.cowtransfer.com/s/c60a5cfec3274f.補(bǔ)充材料(圖、表、腳本、圖形摘要、幻燈片、視頻、中文翻譯版和更新材料)可在在線DOI或iMeta Science中找到http://www.imeta.science/。
引文
Chen, Chengjie, Ya Wu, and Rui Xia. 2022. “A painless way to customize Circos plot: From data preparation to visualization using TBtools.” iMeta. e35. https://doi.org/10.1002/imt2.35
作者簡介
陳程杰(第一作者)
●??華南農(nóng)業(yè)大學(xué)園藝學(xué)院教師,生信工具TBtools作者
●現(xiàn)已在Molecular Plant、Nature Communications、New Phytologist、Horticulture Research等國際知名雜志發(fā)表論文10余篇
夏瑞(通訊作者)
●博導(dǎo),華南農(nóng)業(yè)大學(xué)園藝學(xué)院教授
● 目前是亞熱帶農(nóng)業(yè)生物資源保護(hù)與利用國家重點(diǎn)實(shí)驗(yàn)室和農(nóng)業(yè)部華南地區(qū)園藝作物生物學(xué)與種質(zhì)創(chuàng)制重點(diǎn)實(shí)驗(yàn)室的學(xué)術(shù)骨干和青年學(xué)科帶頭人。2019年獲得廣東省特支計(jì)劃科技創(chuàng)新領(lǐng)軍人才項(xiàng)目支持。長期致力于園藝植物基因組和小分子RNA相關(guān)研究,已取得了國際領(lǐng)先的研究成果,在Nature Genetics, Nature Communication, Molecular Plant和The Plant Cell等學(xué)術(shù)刊物發(fā)表SCI論文50多篇,累計(jì)引用>5000次。目前主要利用生物信息學(xué)、基因組學(xué)及分子生物學(xué)等手段,圍繞無患子科植物花性別分化機(jī)制以及南方主要水果花果發(fā)育調(diào)控機(jī)理等生物學(xué)問題開展研究。并已開發(fā)一系列生物信息數(shù)據(jù)分析工具數(shù)據(jù)庫,如TBtools和sRNAanno(www.plantsRNAs.org)等
更多推薦
(▼ 點(diǎn)擊跳轉(zhuǎn))
iMeta文章中文翻譯+視頻解讀
iMeta封面 | 宏蛋白質(zhì)組學(xué)分析一站式工具集iMetaLab Suite(加拿大渥太華大學(xué)Figeys組)
????
iMeta | 華南師大王璋組綜述人體肺部微生物組與人類健康和疾病之間的隱秘關(guān)聯(lián)
????
iMeta | 南科大夏雨組納米孔測(cè)序揭示微生物可減輕高海拔凍土溫室氣體排放
????
iMeta | 北大陳峰/陳智濱等發(fā)表口腔微生物組研究中各部位取樣的實(shí)驗(yàn)方法(Protocol)
????
iMeta | 華南農(nóng)大曾振靈/熊文廣等-家庭中寵物犬與主人耐藥基因的共存研究
????
iMeta | 深圳先進(jìn)院馬迎飛組開發(fā)基于神經(jīng)網(wǎng)絡(luò)分析腸道菌群的方法
????
iMeta | 南醫(yī)大陳連民等綜述從基因組功能角度揭示腸菌對(duì)復(fù)雜疾病的潛在影響
????
iMeta | 北大陳峰組綜述口腔微生物組的標(biāo)準(zhǔn)化研究:從技術(shù)驅(qū)動(dòng)到假說驅(qū)動(dòng)
????
iMeta | 電子科大林昊組開發(fā)蛋白質(zhì)賴氨酸乳酸化位點(diǎn)預(yù)測(cè)工具DeepKla
????
iMeta | 中科院李小方等膳食甘草促進(jìn)小鼠鎘解毒并調(diào)節(jié)腸道菌群代謝
????
iMeta | 浙大倪艷組MetOrigin實(shí)現(xiàn)代謝物溯源和腸道微生物組與代謝組整合分析
期刊簡介
“iMeta” 是由威立、腸菌分會(huì)和本領(lǐng)域數(shù)百位華人科學(xué)家合作出版的開放獲取期刊,主編由中科院微生物所劉雙江研究員和荷蘭格羅寧根大學(xué)傅靜遠(yuǎn)教授擔(dān)任。目的是發(fā)表原創(chuàng)研究、方法和綜述以促進(jìn)宏基因組學(xué)、微生物組和生物信息學(xué)發(fā)展。目標(biāo)是發(fā)表前10%(IF > 15)的高影響力論文。期刊特色包括視頻投稿、可重復(fù)分析、圖片打磨、青年編委、前3年免出版費(fèi)、50萬用戶的社交媒體宣傳等。2022年2月正式創(chuàng)刊發(fā)行!
聯(lián)系我們
iMeta主頁:http://www.imeta.science
出版社:https://onlinelibrary.wiley.com/journal/2770596x
投稿:https://mc.manuscriptcentral.com/imeta
郵箱:office@imeta.science
?微信公眾號(hào)?
iMeta
?責(zé)任編輯?
微微?
總結(jié)
以上是生活随笔為你收集整理的iMeta | 华南农大陈程杰/夏瑞等发布TBtools构造Circos图的简单方法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 红外接收器的外围电路设计(方法+使用手册
- 下一篇: 获取对话框当前cfont_获取对话框当前