Nucleic Acids Research | NONCODE数据库V6版发布,涵盖全面的动植物长非编码RNA注释
?長非編碼RNA(long non-coding RNA,lncRNA)是一類長度大于200nt的非編碼RNA。大量研究表明,lncRNA具有重要的調控功能,在植物和動物的各種生物學過程中起著重要作用。此外,lncRNA還與人類各種疾病的發生發展密切相關。因此對lncRNA的注釋、探索lncRNA的功能具有非常重要的意義。近年來,很多研究都集中于lncRNA功能的探索,但是綜合全面的lncRNA注釋仍舊需要不斷更新維護。
NONCODE數據庫于2006年創建,受到Science雜志專文推薦,由中科院計算所和生物物理所團隊維護14年,累積訪問過億次。2013年受邀以專家數據庫加入RNAcentral,數據庫首次提出了非編碼基因的分類體系,建立了多項非編碼領域標準,推動lncRNA研究發展。
近日,由中國科學院生物物理研究所陳潤生院士課題組,中科院生物物理所健康大數據研究中心何順民課題組和中國科學院計算技術研究所趙屹課題組合作,在國際學術期刊 《核酸研究》(Nucleic Acids Research)在線發表了題為“NONCODEV6: an updated database dedicated to long non-coding RNA annotation in both animals and plants”的文章(圖1)。該工作NONCODEV6(http://www.noncode.org/)(圖2)是關于動植物多個物種的lncRNA綜合注釋數據庫的升級,旨在提供關于動植物各個物種中lncRNA的全面綜合的注釋和分析。
圖1. NONCODEV6在線發表。
圖2. NONCODEV6數據庫。
在此前積累的NONCODE版本基礎上,研究團隊通過關鍵詞搜索近期發表文章并手工提取lncRNA及其在組織中的表達數據等信息。隨后,對其相應的植物物種、動物物種、組織表達數據進行了收集、整理,之后進入NONCODE數據庫更新的流程,進行數據的過濾、處理、注釋。
NONCODEV6中總共記錄了644,510個lncRNA。此次新加入的植物物種數目達23種,包括常見植物擬南芥,水稻,小麥,玉米等。?植物物種的lncRNA注釋包括基本位置信息、序列信息、長度、外顯子個數、組織的表達量、功能注釋等。同時,研究團隊對人和小鼠的數據進行了更新,并加入lncRNA和腫瘤等疾病的關系注釋,整合了多個lncRNA和腫瘤的數據源,提供了一個關于腫瘤等疾病和NONCODE數據庫中lncRNA的綜合注釋。
此外,NONCODEV6數據庫提供了一個用戶友好的界面,可用于瀏覽各個物種的lncRNA的具體情況,包括長度、序列、位置、功能注釋、保守性注釋等。除此之外,還提供了blast功能、功能注釋查詢、保守性查詢。總體來說,NONCODEV6 (http://www.noncode.org/) 是一個業內較為認可的綜合性lncRNA注釋的知識庫。
綜上,NONCODEV6為研究基于lncRNA的在動物和植物的相關注釋提供了重要支撐。
中國科學院生物物理研究所陳潤生院士、何順民研究員和中國科學院計算技術研究所趙屹研究員為本文共同通訊作者。中國科學院計算技術研究所趙連鶴和中國科學院生物物理研究所健康大數據研究中心王佳佳、李燕燕為本文并列第一作者。該文章獲得國家重點研發項目、國家自然科學基金、中國科學院戰略重點研究項目等項目資助。
文章鏈接:https://doi.org/10.1093/nar/gkaa1046
SpatialDB |單細胞空間轉錄組數據分析可視化平臺
如果您也想做一個類似的數據庫,可以聯系我們:你的數據也可以-三篇NAR的數據庫
往期精品(點擊圖片直達文字對應教程)
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
?
總結
以上是生活随笔為你收集整理的Nucleic Acids Research | NONCODE数据库V6版发布,涵盖全面的动植物长非编码RNA注释的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 结束十年科学争论,张辰宇团队阐明食物mi
- 下一篇: 挖掘PubMed数据库,获取报道的或推测