NAR | IMG/VR v4:在广泛的功能、分类学和生态学元数据框架内的未培养病毒基因组扩展数据库...
在廣泛的功能、分類學和生態學元數據框架內的未培養病毒基因組擴展數據庫
IMG/VR v4: an expanded database of uncultivated virus genomes within a framework of extensive functional, taxonomic, and ecological metadata
Article,Nucleic Acids Research,2023-01-06, [IF 19.16]
DOI:10.1093/nar/gkac1037
第一作者:Antonio Pedro Camargo(共通訊)
通訊作者:Nikos C Kyrpides, Simon Roux
主要單位:聯合基因組研究所,勞倫斯伯克利國家實驗室,伯克利(DOE Joint Genome Institute, Lawrence Berkeley National Laboratory, Berkeley, CA 94720, USA DOE)
翻譯:周之超@UW-Madison
- 背景 -
病毒被廣泛認為是所有微生物組的重要成員。宏基因組學實現了對全球病毒圈的大規模探索,逐步揭示了地球上病毒的廣泛基因組多樣性,并強調了病毒影響生物過程的各種方式。IMG/VR提供了從(宏)基因組獲得的最大的病毒序列集合,以及功能注釋和豐富的元數據(metadata)。一個網絡界面使用戶能夠根據基因組特征和/或序列相似性有效地瀏覽和搜索病毒。在這里,我們提出了IMG/VR的第四個版本,由超過1500萬個病毒基因組和基因組片段組成,與前一個版本相比,規模增加了≈6倍。這些病毒聚類為870萬個病毒操作分類單位,包括231408個至少有一個高質量的代表。IMG/VR中的病毒序列現在使用一種新的檢測方法(geNomad)從基因組、元基因組和元轉錄組中系統地識別出來,IMG標準注釋還輔以使用CheckV的基因組質量評估、反映最新分類標準的分類法和微生物宿主分類法的預測。IMG/VR v4可在https://img.jgi.doe.gov/vr,基礎數據可在https://genome.jgi.doe.gov/portal/IMG_VR 下載。
相比于2022年年初發表的V3(https://mp.weixin.qq.com/s/kytq3Ec35EUO_RMOn24Hzg ),2023年年初發表的IMG/VR V4有如下方面的提升:
1.病毒基因組和片段的數量達到1500萬個,是以前的6倍。231408個vOTU至少有一個高質量代表序列,比之前的數字11577提升了近20倍。
2.添加了豐富的元數據,在用戶界面和下載頁面可以方便獲取。
3.發明了新的檢測方法geNomad。
- 討論(需要注意的方面) -
1.雖然在過去的幾年里,病毒序列預測工具的性能和準確性有了很大的提高,但這些預測仍然不完善,特別是對于短序列和與其他類型的移動遺傳元素(如質粒)密切相關的病毒。由于不同類型的UViG分析可以容納不同程度的非病毒序列,而且為了使用戶能夠應用他們自己喜歡的嚴格程度,IMG/VR v4現在將最有把握的預測歸入 "高信心 "類別,并提供與每個UViG相關的原始geNomad分數,以便進一步細化。
2.目前的預測方法通常存在召回率(recall)低或準確性(accuracy)低的問題。對于IMG/VR v4,選擇了一套保守的方法和截止點,這應該產生準確的預測,但只對少數的UViG產生預測。盡管如此,對這些宿主的預測應謹慎解釋,不能將其視為確定的病毒-宿主關聯。
3.自2016年以來,IMG/VR通過提供來自廣泛環境和病毒類型的大量病毒基因組,成為病毒生態學領域的旗艦數據庫。這里介紹的新的IMG/VR v4版本擁有迄今為止最大的UViGs集合。
參考文獻
Antonio Pedro Camargo, Stephen Nayfach, I-Min A Chen, Krishnaveni Palaniappan, Anna Ratner, Ken Chu, Stephan J Ritter, T B K Reddy, Supratim Mukherjee, Frederik Schulz, Lee Call, Russell Y Neches, Tanja Woyke, Natalia N Ivanova, Emiley A Eloe-Fadrosh, Nikos C Kyrpides, Simon Roux, IMG/VR v4: an expanded database of uncultivated virus genomes within a framework of extensive functional, taxonomic, and ecological metadata, Nucleic Acids Research, Volume 51, Issue D1, 6 January 2023, Pages D733–D743, https://doi.org/10.1093/nar/gkac1037
- 作者簡介 -
微生物組數據科學組
Nikos C. Kyrpides?
Ph.D
Kyrpides博士于2004年加入能源部聯合基因組研究所,領導基因組生物學項目和微生物基因組和元基因組的比較分析平臺(IMG)的開發。他在2010年成為元基因組學項目負責人,并從2011年起負責微生物基因組和元基因組的合并項目。在加入能源部聯合基因組研究所之前,Kyrpides博士在伊利諾伊州芝加哥的Integrated Genomics Inc.領導基因組分析和生物信息學核心的發展。他在伊利諾伊大學厄巴納-香檳分校和阿貢國家實驗室跟隨Carl Woese進行了博士后研究。Kyrpides博士的研究重點是微生物組研究,重點是微生物組數據科學。他的小組正在開發新的方法,以實現大規模的比較分析,以及大數據的挖掘和可視化。
https://jgi.doe.gov/our-science/scientists-jgi/nikos-kyrpides/
美國能源部聯合基因組研究所
Simon Roux
組長,Ph.D
Roux博士于2017年加入JGI,作為元基因組計劃的一部分領導病毒基因組學研究。他的職責包括開發新的計算工具來識別病毒序列,設計新的實驗方法將病毒與它們的宿主聯系起來,與JGI用戶合作分析病毒數據集,并組織病毒生態基因組學領域的社區建設工作。對于這個角色,Roux博士可以依靠他在病毒生態學和病毒基因組學領域超過10年的專業知識,他在那里參與了跨學科的合作研究,重點是發展微生物系統中病毒多樣性和病毒-宿主互動的基礎知識。通過2021年能源部早期職業研究計劃,Roux博士在JGI建立了病毒基因組學小組,目前正在領導該小組進一步探索土壤微生物群落中病毒-宿主動態的生態和進化驅動因素。
https://jgi.doe.gov/our-science/scientists-jgi/simon-roux/
猜你喜歡
iMeta簡介?高引文章?高顏值繪圖imageGP?網絡分析iNAP
iMeta網頁工具?代謝組MetOrigin?美吉云乳酸化預測DeepKla
iMeta綜述?腸菌菌群?植物菌群?口腔菌群?蛋白質結構預測
10000+:菌群分析?寶寶與貓狗?梅毒狂想曲?提DNA發Nature
系列教程:微生物組入門?Biostar?微生物組??宏基因組
專業技能:學術圖表?高分文章?生信寶典?不可或缺的人
一文讀懂:宏基因組?寄生蟲益處?進化樹?必備技能:提問?搜索??Endnote
擴增子分析:圖表解讀?分析流程?統計繪圖
16S功能預測???PICRUSt??FAPROTAX??Bugbase?Tax4Fun
生物科普:??腸道細菌?人體上的生命?生命大躍進??細胞暗戰?人體奧秘??
寫在后面
為鼓勵讀者交流快速解決科研困難,我們建立了“宏基因組”討論群,己有國內外6000+ 科研人員加入。請添加主編微信meta-genomics帶你入群,務必備注“姓名-單位-研究方向-職稱/年級”。高級職稱請注明身份,另有海內外微生物PI群供大佬合作交流。技術問題尋求幫助,首先閱讀《如何優雅的提問》學習解決問題思路,仍未解決群內討論,問題不私聊,幫助同行。
點擊閱讀原文,跳轉最新文章目錄閱讀
總結
以上是生活随笔為你收集整理的NAR | IMG/VR v4:在广泛的功能、分类学和生态学元数据框架内的未培养病毒基因组扩展数据库...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Make PGP messages an
- 下一篇: mysql查找top k_查询分页---