NCB之taxonomy系列
1、taxonomy之簡介
生物分類學是研究生物系統的一種強有力的組織原則。遺傳、共同遺傳的同源性以及在確定功能時保護序列和結構,這些都是生物學的中心思想,直接關系到任何一組生物體的進化史。因此,分類法在許多NCBI工具和數據庫中扮演著重要的交聯角色。NCBI分類法數據庫是對GenBank中表示的所有生物體的名稱和分類進行整理的集合。當向GenBank提交新的序列時,將檢查提交的序列中是否有新的生物名稱,然后對這些名稱進行分類并添加到分類法數據庫中。截至2003年4月1日,共有4653科26427屬130207種,總分類單元176890個。構建分類法的幾種不同方法中,我們的小組維護了一個系統發生分類法。在系統發生分類方案中,分類樹的結構近似于分類中所包含的生物體(“生命樹”)之間的進化關系;請參見圖1)。
我們不單獨依賴序列數據來構建分類,也不作為分類法項目的一部分自己執行系統發育分析。GenBank中的大多數生物僅由一小段序列表示;因此,僅靠序列信息不足以建立一個強健的系統發育。絕大多數的物種根本不在那里,盡管大約50%的鳥類和哺乳動物都在那里。因此,我們也依賴于形態學研究的分析;現代系統學的挑戰是統一分子和形態學的數據來闡明演化過程。目前,每天有100多個新物種被添加到數據庫中,隨著序列分析成為系統研究和新物種分類描述中越來越常見的組成部分,這一速度正在加快。
EMBL DDBJ數據庫,以及基因庫,現在使用NCBI分類法作為核苷酸序列的分類標準(見附表1)。幾乎所有的數據庫中發現的新物種分類通過序列提交其中一個數據庫從物種還沒有代表。在這些情況下,會咨詢NCBI分類法組,在序列條目公開之前,命名和分類方面的任何問題都會得到解決。我們也收到未被鑒定為物種級別的意見書的咨詢(例如,“漢坦病毒”或“巴西爾病毒”)
分類法瀏覽器(TaxBrowser)提供分類法中任何特定位置的分類的層次視圖。對于大多數對我們的分類感興趣的普通用戶(瀏覽器)來說,這可能是首選的顯示方式。TaxBrowser只顯示分類法數據庫中鏈接到公共序列條目的分類單元的子集。大約15%的完整分類法數據庫沒有顯示在公共Web頁面上,因為名稱來自尚未發布的序列條目。axBrowser不斷更新。在Entrez數據庫的每日發布周期中,隨著新名稱以索引的序列條目的形式出現,新的物種將每天出現。分類中的新分類單元會不斷地出現在TaxBrowser中,因為已經鏈接到公共序列條目的分類單元部分會被修改。
數據庫中的每個分類單元都有一個惟一的標識符,它的taxid。taxid是按順序分配的。當一個分類單元被刪除時,它的taxid消失,沒有重新分配(表1;請參閱FTP以獲得已刪除的taxid的列表)。當一個分類單元合并與另一個分類單元(例如,如果名字是決心是同義詞或一個是拼寫錯誤),節點已經消失了的taxid被列為“二級taxid”taxid的節點(參見FTP站點上的合并taxid文件)。在這兩種情況下,已經消失的taxid將永遠不會分配給數據庫中的新條目。
ftp://ftp.ncbi.nih.gov/pub/taxonomy/ 的索引
總結
以上是生活随笔為你收集整理的NCB之taxonomy系列的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: pfSense用户界面汉化翻译教程
- 下一篇: 怎么创建具有真实纹理的CG场景岩石?