日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

clustalw序列比对_几个多序列比对软件:Muscle,ClustalW和T-coffee的简单比较

發(fā)布時(shí)間:2023/12/20 编程问答 52 豆豆
生活随笔 收集整理的這篇文章主要介紹了 clustalw序列比对_几个多序列比对软件:Muscle,ClustalW和T-coffee的简单比较 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

ClustalW是現(xiàn)在用的最廣和最經(jīng)典的多序列比對(duì)軟件, Muscle是速度最快的多序列比對(duì)之一,T-coffee是越來越受到歡迎的軟件.它們各自有什么優(yōu)點(diǎn)和缺點(diǎn)呢?

ClustalW不僅可以用來做多序列比對(duì),也能做Profile-profile比對(duì),以及基于Neighbor-joining方法構(gòu)建進(jìn)化樹.但是最常用的是多序列比對(duì).從速度上來說,它有兩種運(yùn)行模式:accurate,slow 和fast,appropriate.即使是fast模式它的速度也不如Muscle,但是slow模式也比T-coffee要快.

ClustalW的基本原理是首先做序列的兩兩比對(duì),根據(jù)該兩兩比對(duì)計(jì)算兩兩距離矩陣,然后用NJ或者UPGMA方法構(gòu)建Binary進(jìn)化樹作為guide tree,最后用progressive的方法根據(jù)guide tree逐步添加序列進(jìn)行比對(duì),一直到所有序列都比對(duì)好.

Muscle的功能僅限于多序列比對(duì),它的最大優(yōu)勢(shì)是速度,比clustalw的速度快幾個(gè)數(shù)量級(jí),而且序列數(shù)越多速度的差別越大.它的時(shí)間復(fù)雜度為O(NL^2+N^3L),空間復(fù)雜度為O(N^2+NL+L^2).它之所以比clustalw快一方面是因?yàn)闆]有進(jìn)行兩兩序列比對(duì),用序列間共有的word數(shù)表征序列間的相似性;另一方面用UPGMA代替NJ構(gòu)建guide tree. 如果沒有對(duì)于結(jié)果的refinement過程,時(shí)間更短,時(shí)間復(fù)雜度為O(NL^2),也就是說時(shí)間和序列數(shù)成線性關(guān)系.一個(gè)形象的例子是,5000條長(zhǎng)度為350的數(shù)據(jù)進(jìn)行比對(duì)只需要7分鐘,而用Clustalw則可能需要1年. 盡管如此,muscle對(duì)于內(nèi)存的要求較高,從它的空間復(fù)雜度可以看出來.

T-coffee之所以廣受歡迎可能是因?yàn)樗臏?zhǔn)確度和強(qiáng)大的功能.它能夠整合很多信息,如結(jié)構(gòu)信息,實(shí)驗(yàn)數(shù)據(jù)等用于序列比對(duì).它的基本原理是首先構(gòu)建一個(gè)庫包含有clustalw得到的序列兩兩比對(duì)和fasta得到的局部?jī)蓛杀葘?duì),并且給每個(gè)比對(duì)一個(gè)權(quán)重.然后把全局比對(duì)和局部比對(duì)的結(jié)果進(jìn)行整合,每個(gè)兩兩比對(duì)中每個(gè)位點(diǎn)的比對(duì)都是綜合了庫中該兩兩比對(duì)的序列和其他序列比對(duì)的結(jié)果,這樣就給該位點(diǎn)比對(duì)一個(gè)權(quán)重用以表明該位點(diǎn)的該比對(duì)在整個(gè)庫中的合理性程度.最后是progressive比對(duì)過程..該方法的最大優(yōu)勢(shì)在于能夠整合各種信息,所以它的可拓展性較強(qiáng),從2000年出現(xiàn)以來到現(xiàn)在T-coffee得到了極大的發(fā)展,功能非常豐富. 但是它的缺點(diǎn)是速度非常慢,其時(shí)間復(fù)雜度為O(N^2L^2)+O(N^3L)+O(N^3)+O(NL^2),因此數(shù)據(jù)集較小(n<100)的時(shí)候用它比較合適.

以上是三個(gè)軟件的比較簡(jiǎn)單的比較,如果想知道的更具體需要看原始文獻(xiàn).需要注意的是,雖然從總體上來說,不同的軟件的效果不一樣,但是如果我們只是針對(duì)具體的問題想做一個(gè)比對(duì),那么最好是綜合幾種方法得到的結(jié)果更可靠. 此外,當(dāng)序列的相似性較高的時(shí)候(>80%),以上的任何一個(gè)軟件的準(zhǔn)確度都能夠達(dá)到90%以上.

相關(guān)的論文:

ClustalW和ClustalX

ClustalW and ClustalX version 2 (2007) Larkin MA, Blackshields G, Brown NP, Chenna R, McGettigan PA, McWilliam H, Valentin F, Wallace IM, Wilm A, Lopez R, Thompson JD, Gibson TJ and Higgins DG .Bioinformatics 2007 23(21): 2947-2948.?doi:10.1093/bioinformatics/btm404

A new bioinformatics analysis tools framework at EMBL-EBI (2010).Goujon M, McWilliam H, Li W, Valentin F, Squizzato S, Paern J, Lopez R.Nucleic acids research 2010 Jul, 38 Suppl: W695-9.doi:10.1093/nar/gkq313

Muscle

T-coffee

T-Coffee: A novel method for multiple sequence alignments.Notredame,Higgins,Heringa,JMB,302(205-217)2000?[pdf][medline]

總結(jié)

以上是生活随笔為你收集整理的clustalw序列比对_几个多序列比对软件:Muscle,ClustalW和T-coffee的简单比较的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。