日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 >

Nanopore牛津纳米孔测16S学习笔记

發(fā)布時間:2023/12/8 42 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Nanopore牛津纳米孔测16S学习笔记 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

身處這樣一個互聯(lián)網(wǎng)時代,應(yīng)當(dāng)感恩技術(shù)帶來的便利,從在一個地方不遠(yuǎn)游就只能是井底之蛙,到今天互聯(lián)網(wǎng)讓我們不出門知天下事,當(dāng)然,假消息也有。雖然現(xiàn)在許多事和技能仍然需要項目實踐,但是不得不說,知識已經(jīng)不再是一種稀缺的資源,需要時間訓(xùn)練的技能才是。我們應(yīng)該充分利用好這個時代提供給我們的便利,努力學(xué)習(xí)和思考。

雖然川普四處設(shè)限,但是地球村依然變得越來越“小”,就拿我們生命科學(xué)領(lǐng)域來說,ncbi數(shù)據(jù)庫,讓我們每個人都有機會接觸到測序原始數(shù)據(jù),可以進(jìn)行分析再現(xiàn)和學(xué)習(xí)。手上雖然沒有“便宜”的納米孔測序儀,但是借助科學(xué)研究者的數(shù)據(jù),依然可以對其一探究竟。這里,我在牛津納米孔公司官網(wǎng)看到了幾篇最新發(fā)表的采用其技術(shù)濃度測序16S的文獻(xiàn),下載了原始數(shù)據(jù),學(xué)習(xí)一下測16S的可行性和數(shù)據(jù)分析方法。

令我大跌眼鏡的原始數(shù)據(jù)

隨便拿了幾個數(shù)據(jù),fastqc來看一下,好家伙,質(zhì)量確實有點低,當(dāng)然,這應(yīng)該是R9.4,9.5或者更早版本的試劑,相信以后會更好。看來直接測了分析高可變區(qū)的16S是不怎么可行的,當(dāng)然,如果有特殊方法來解決是可以的,比如Pacbio的循環(huán)測序和把一個拷貝多份連在一條上,也實現(xiàn)測多次的效果,當(dāng)然,依然無法消除那種系統(tǒng)錯誤,比如技術(shù)本身缺陷,插入或缺失(后面的NanoApli-seq就是后面一種方法)。還不得不吐槽一下這家公司,只對有測序儀的用戶開放社區(qū)論壇,這樣就讓技術(shù)只局限在了一個小圈子,封閉并不利于該公司的發(fā)展。

?

幾篇文章的略讀

  • 1.Cusco? A, Catozzi C, Vin?es J et al. Microbiota profiling with long amplicons using Nanopore sequencing: full-length 16S rRNA gene and whole rrn operon 這篇文章采用了比較測16S和rrn序列(16S rRNA–ITS–23S rRNA; 4,500 bp),結(jié)果使用EPI2ME的話16S序列中只有68%的序列能夠匹配到正確的分類。我學(xué)得這個方法基本上沒有可用性呢。?
  • 2.E. Curren, T. Yoshida, V.S. Kuwahara et al. Rapid profiling of tropical marine cyanobacterial communities
  • 這篇文章采用9.4版本的試劑,1D的建庫方式,得到的平均Q值為11.7,算了下準(zhǔn)確度為91.17%,大概也就這么高了。這篇文章是采用qiime流程進(jìn)行后續(xù)處理的。這篇文章是測熱帶海洋藍(lán)藻的,對于細(xì)菌菌落可能不大能說明問題。
  • 3.Rapid bacterial identification by direct PCR amplification of 16S rRNA genes using the MinION nanopore sequencer
  • 這篇文章的流程如下圖所示:??是使用 GSTK software suite進(jìn)行數(shù)據(jù)分析的(比對和注釋序列)。
  • 4.NanoAmpli-Seq: a work ow for amplicon sequencing for mixed microbial communities on the nanopore sequencing platform
  • 這篇是我前面提到的采用串聯(lián)線性片段進(jìn)行測序的文章,看它的文庫制備有些復(fù)雜,原理圖放在這:?

最后一篇文章分析過程學(xué)習(xí)

上面這張圖是關(guān)于數(shù)據(jù)分析的過程圖解,主要包括INC-Seq,ChaoSeq, nanoClust三個過程,后兩個分別對應(yīng)了兩個腳本文件chopSEQ.py和nanoCLUST.py。第一個應(yīng)該是整個過程的預(yù)覽。作者公開了兩個數(shù)據(jù),能下載的只有一個,ERR2241540.sra,大小是10M,fasq-dump解壓完只有4.6M,我感到很意外,壓縮壓大了?查了下,還真有這種情況出現(xiàn)。

看到討論里的幾句話,瞬間覺得納米孔不適合做這種16S群落分析,特別是物種組成復(fù)雜時。

1.由于序列質(zhì)量不夠,沒辦法使用vsearch等軟件進(jìn)行聚類,只能通過分區(qū)序列聚類來基本滿足物種分類要求; 2.150X, 也就是50個長reads(3X),可以實現(xiàn)共識序列精度達(dá)到99%+。但是精度仍然低于illumina或者Pacbio的測序準(zhǔn)確度(Pacbio不是系統(tǒng)錯誤,是隨機錯誤)。而且,即使增加測序深度,精度也不會提高,這說明至少在現(xiàn)階段,這的確是個系統(tǒng)錯誤; 3.產(chǎn)量低,能basecalling的僅僅是原始數(shù)據(jù)的一小部分,如7%–9%的1D方數(shù)據(jù)。如果使用1D的建庫方式或許能解決這個問題,但是精度只有94%,就不適合進(jìn)行上述的聚類了; 4.一個聚類會產(chǎn)生多個共識序列,可能會導(dǎo)致物種分類錯誤。

如果有可能的話,后面學(xué)習(xí)一下它的分析過程命令行,現(xiàn)在卡在了軟件安裝上,晚會續(xù)上。

總結(jié)

以上是生活随笔為你收集整理的Nanopore牛津纳米孔测16S学习笔记的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。