rrnDB数据库简介-16S基因多拷贝数的证据
16S基因作為mark gene在微生物群落結(jié)構(gòu)的研究中發(fā)揮中重要作用, 但是候選的mark gene 肯定不止16S 一種,最新比較火熱的功能基因,也可以作為mark gene。利用功能基因作為mark? gene, 相比16S有什么優(yōu)勢呢?
在功能基因的文獻(xiàn)中指出了兩點(diǎn):
1) 不同物種的16S基因序列可能完全相同,尤其是在二代測序中,我們通常指擴(kuò)增16S的部分序列,這樣不同物種擴(kuò)增出來的序列完全相同的概率大大增加,這樣不同有效的區(qū)分物種,所以說利用16S基因做的species 水平的注釋,可信度一般;
2)16S基因在一個(gè)物種中會有多拷貝,這樣PCR是會有多個(gè)擴(kuò)增產(chǎn)物,這樣導(dǎo)致在OTU 定量會引入錯(cuò)誤,比如物種A只有1個(gè)16S基因,物種B有2個(gè)16S基因,在群落中,二者豐度相同,經(jīng)過相同循環(huán)次數(shù)的PCR , 理論上最終測序得到的reads中,物種B的reads會是物種A的2倍; 在16S研究中,我們通常使用reads 表征某個(gè)OTU的分度,盡管在群落中物種A和B相同,但是由于拷貝數(shù)的差異,所以定量的結(jié)果,不能正確的反映在群落中二者的豐度比例;豐度定量不準(zhǔn)確,對于后續(xù)的alpha 和 beta 多樣性的分析都會有影響;
之前只是文章中這么一說,對于某個(gè)物種16S的拷貝數(shù)也沒有認(rèn)真去研究過,今天看到了rrnDB 這個(gè)數(shù)據(jù)庫;
這個(gè)數(shù)據(jù)庫中收錄了16S基因?yàn)槎嗫截惖奈锓N;可以直觀的看到16S基因多拷貝的現(xiàn)象;
數(shù)據(jù)庫網(wǎng)址如下:
https://rrndb.umms.med.umich.edu/
點(diǎn)擊導(dǎo)航欄的 search 按鈕,先看一下數(shù)據(jù)庫中的具體記錄
先用默認(rèn)的關(guān)鍵字進(jìn)行檢索,看下檢索出來的記錄,點(diǎn)擊下圖的Search 按鈕,
檢索的結(jié)果如下:
?第一列Data source record id 是物種基因組在NCBI中的版本號,Data source organism name 是物種名稱,RDP? taxa 是在RDP 數(shù)據(jù)庫中的注釋信息,最后一列16S copies 就是在該物種中16S基因的拷貝數(shù);
從檢索的結(jié)果可以直觀的看出,還是有很多的物種存在16S基因多拷貝的現(xiàn)象;
最新更新的RDP Classifier 程序中,考慮了16S基因的多拷貝現(xiàn)象,對于16S基因的多拷貝數(shù)問題,通過這個(gè)數(shù)據(jù)庫可以更加直觀的了解。
?
與50位技術(shù)專家面對面20年技術(shù)見證,附贈技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的rrnDB数据库简介-16S基因多拷贝数的证据的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python第二十二天 stat模块
- 下一篇: mysql 5.7 学习