glean工具和maker工具
glean工具
當(dāng)用各類工具完成了注釋后,一個問題是,每一個基因組區(qū)域,都會獲得大量redundant的基因結(jié)構(gòu)注釋,到底哪一個注釋才是最可靠的?所以,我們需要一個整合工具。
有一種工具是通過統(tǒng)計(jì)打分,先手工注釋一些基因,然后把所有的自動注釋結(jié)果跟手工注釋比較,給各個工具打個分,最后用這個打分矩陣擴(kuò)展到所有的基因上。常用的有g(shù)lean,它不需要training。
GLEAN是一個無監(jiān)督的學(xué)習(xí)系統(tǒng),可以整合不同來源的基因結(jié)構(gòu)證據(jù)(基因模型預(yù)測,EST /蛋白質(zhì)基因組序列比對,SAGE /肽標(biāo)簽等)以產(chǎn)生一致性的基因預(yù)測,而無需事先訓(xùn)練。
我們使用GLEAN創(chuàng)建了蜜蜂(Apis mellifera)的共有基因集,這是一種新算法,該算法使用潛在類別分析來在不存在已知基因的情況下自動整合不同的基因預(yù)測證據(jù)。與任何一種輸入基因預(yù)測相比,共有基因模型在不犧牲質(zhì)量的情況下增加了蜜蜂基因的代表性。當(dāng)與手動注釋的金標(biāo)準(zhǔn)進(jìn)行比較時,基因模型的共有集在質(zhì)量上與每個輸入集相似或更高。
GLEAN是將基因列表組合到單個參考集中的有效方法。
evidence modeler是pasa的開發(fā)者做的另一個工具,文檔詳細(xì),使用簡單,而且它自帶很多格式轉(zhuǎn)換代碼,雖然這個工具也需要training,但是它也可以人工打分,雖然人工給的不是最好 http://evidencemodeler.sourceforge.net/
參考來源:
https://genomebiology.biomedcentral.com/articles/10.1186/gb-2007-8-1-r13
maker工具
從頭構(gòu)建一個物種的基因組,至少包含三個步驟:序列拼接、基因結(jié)構(gòu)注釋和基因功能注釋。
其中,基因結(jié)構(gòu)注釋原理上是最為復(fù)雜的,需要首先根據(jù)序列結(jié)構(gòu)、已有的轉(zhuǎn)錄本序列、蛋白序列,尋找基因結(jié)構(gòu)的證據(jù),然后對這些證據(jù)進(jìn)行整合,給出最終判斷。在注釋之前,還要考慮重復(fù)序列的影響。
MAKER 是一款強(qiáng)大的結(jié)構(gòu)注釋流程,它整合了所有以上步驟涉及到的主流算法和軟件,使我們能夠快速完成基因結(jié)構(gòu)注釋。
本課程介紹基因結(jié)構(gòu)注釋的原理以及 MAKER 的用法。
MAKER官網(wǎng):http://www.yandell-lab.org/software/maker.html
MAKER軟件使用說明
輸入文件,主要有三個(fasta格式):
基因組序列、RNA序列(ESTs/cDNA/mRNA transcripts)、相關(guān)或者近源物種的蛋白質(zhì)序列
運(yùn)行maker –CTL,生成如下三個文件:
?maker_exe.ctl- contains the path information for the underlying executables.
?maker_bopt.ctl- contains filtering statistics for BLAST and Exonerate
?maker_opt.ctl- contains all other information for MAKER, including the location of the input genome file.
修改中的maker_opts.ctl的參數(shù)。
運(yùn)行maker
參考來源:
http://www.genek.tv/course/52
http://blog.sina.com.cn/s/blog_83f77c940102vzeo.html
總結(jié)
以上是生活随笔為你收集整理的glean工具和maker工具的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 教你win10系统显卡驱动安装失败的解决
- 下一篇: 电信光猫tewa-708e超级密码_天翼