當(dāng)前位置：首頁 >

Nanopore牛津纳米孔测16S学习笔记

發(fā)布時間：2023/12/8 42 豆豆

生活随笔收集整理的這篇文章主要介紹了 Nanopore牛津纳米孔测16S学习笔记小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

身處這樣一個互聯(lián)網(wǎng)時代，應(yīng)當(dāng)感恩技術(shù)帶來的便利，從在一個地方不遠(yuǎn)游就只能是井底之蛙，到今天互聯(lián)網(wǎng)讓我們不出門知天下事，當(dāng)然，假消息也有。雖然現(xiàn)在許多事和技能仍然需要項目實踐，但是不得不說，知識已經(jīng)不再是一種稀缺的資源，需要時間訓(xùn)練的技能才是。我們應(yīng)該充分利用好這個時代提供給我們的便利，努力學(xué)習(xí)和思考。

雖然川普四處設(shè)限，但是地球村依然變得越來越“小”，就拿我們生命科學(xué)領(lǐng)域來說，ncbi數(shù)據(jù)庫，讓我們每個人都有機會接觸到測序原始數(shù)據(jù)，可以進(jìn)行分析再現(xiàn)和學(xué)習(xí)。手上雖然沒有“便宜”的納米孔測序儀，但是借助科學(xué)研究者的數(shù)據(jù)，依然可以對其一探究竟。這里，我在牛津納米孔公司官網(wǎng)看到了幾篇最新發(fā)表的采用其技術(shù)濃度測序16S的文獻(xiàn)，下載了原始數(shù)據(jù)，學(xué)習(xí)一下測16S的可行性和數(shù)據(jù)分析方法。

令我大跌眼鏡的原始數(shù)據(jù)

隨便拿了幾個數(shù)據(jù)，fastqc來看一下，好家伙，質(zhì)量確實有點低，當(dāng)然，這應(yīng)該是R9.4，9.5或者更早版本的試劑，相信以后會更好。看來直接測了分析高可變區(qū)的16S是不怎么可行的，當(dāng)然，如果有特殊方法來解決是可以的，比如Pacbio的循環(huán)測序和把一個拷貝多份連在一條上，也實現(xiàn)測多次的效果，當(dāng)然，依然無法消除那種系統(tǒng)錯誤，比如技術(shù)本身缺陷，插入或缺失（后面的NanoApli-seq就是后面一種方法）。還不得不吐槽一下這家公司，只對有測序儀的用戶開放社區(qū)論壇，這樣就讓技術(shù)只局限在了一個小圈子，封閉并不利于該公司的發(fā)展。

幾篇文章的略讀

1.Cusco? A, Catozzi C, Vin?es J et al. Microbiota profiling with long amplicons using Nanopore sequencing: full-length 16S rRNA gene and whole rrn operon 這篇文章采用了比較測16S和rrn序列（16S rRNA–ITS–23S rRNA; 4,500 bp），結(jié)果使用EPI2ME的話16S序列中只有68%的序列能夠匹配到正確的分類。我學(xué)得這個方法基本上沒有可用性呢。?
2.E. Curren, T. Yoshida, V.S. Kuwahara et al. Rapid profiling of tropical marine cyanobacterial communities
這篇文章采用9.4版本的試劑，1D的建庫方式，得到的平均Q值為11.7，算了下準(zhǔn)確度為91.17%，大概也就這么高了。這篇文章是采用qiime流程進(jìn)行后續(xù)處理的。這篇文章是測熱帶海洋藍(lán)藻的，對于細(xì)菌菌落可能不大能說明問題。
3.Rapid bacterial identification by direct PCR amplification of 16S rRNA genes using the MinION nanopore sequencer
這篇文章的流程如下圖所示：??是使用 GSTK software suite進(jìn)行數(shù)據(jù)分析的（比對和注釋序列）。
4.NanoAmpli-Seq: a work ow for amplicon sequencing for mixed microbial communities on the nanopore sequencing platform
這篇是我前面提到的采用串聯(lián)線性片段進(jìn)行測序的文章，看它的文庫制備有些復(fù)雜，原理圖放在這：?

最后一篇文章分析過程學(xué)習(xí)

上面這張圖是關(guān)于數(shù)據(jù)分析的過程圖解，主要包括INC-Seq，ChaoSeq, nanoClust三個過程，后兩個分別對應(yīng)了兩個腳本文件chopSEQ.py和nanoCLUST.py。第一個應(yīng)該是整個過程的預(yù)覽。作者公開了兩個數(shù)據(jù)，能下載的只有一個，ERR2241540.sra，大小是10M，fasq-dump解壓完只有4.6M，我感到很意外，壓縮壓大了？查了下，還真有這種情況出現(xiàn)。

看到討論里的幾句話，瞬間覺得納米孔不適合做這種16S群落分析，特別是物種組成復(fù)雜時。

1.由于序列質(zhì)量不夠，沒辦法使用vsearch等軟件進(jìn)行聚類，只能通過分區(qū)序列聚類來基本滿足物種分類要求； 2.150X, 也就是50個長reads（3X），可以實現(xiàn)共識序列精度達(dá)到99%+。但是精度仍然低于illumina或者Pacbio的測序準(zhǔn)確度（Pacbio不是系統(tǒng)錯誤，是隨機錯誤）。而且，即使增加測序深度，精度也不會提高，這說明至少在現(xiàn)階段，這的確是個系統(tǒng)錯誤； 3.產(chǎn)量低，能basecalling的僅僅是原始數(shù)據(jù)的一小部分，如7%–9%的1D方數(shù)據(jù)。如果使用1D的建庫方式或許能解決這個問題，但是精度只有94%，就不適合進(jìn)行上述的聚類了； 4.一個聚類會產(chǎn)生多個共識序列，可能會導(dǎo)致物種分類錯誤。

如果有可能的話，后面學(xué)習(xí)一下它的分析過程命令行，現(xiàn)在卡在了軟件安裝上，晚會續(xù)上。

總結(jié)

以上是生活随笔為你收集整理的Nanopore牛津纳米孔测16S学习笔记的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：使用高级语言编写计算机程序步骤,计算机执
下一篇：如何把新加的分区挂载到/根目录