illumina 双端测序(pair end)
本文來自 sixu_9days 的CSDN 博客 :https://blog.csdn.net/sixu_9days/article/details/78948914
illumina測(cè)序的核心在于利用可逆終止的、熒光標(biāo)記的dNTP進(jìn)行邊合成邊測(cè)序(Sequencing-By-Synthesis,SBS)
Flowcell(流動(dòng)池)是有著2個(gè)或8個(gè)lane(泳道)的玻璃板,每個(gè)lane可以測(cè)一個(gè)樣本或者多樣本的混合物,且隨機(jī)布滿了能夠與文庫兩端接頭分別互補(bǔ)配對(duì)或一致的寡核苷酸(oligos,P7和P5接頭)。一個(gè)lane包含兩列,每一列有60個(gè)tile,每個(gè)tile會(huì)種下不同的cluster,每個(gè)tile在一次循環(huán)中會(huì)拍照4次(每個(gè)堿基一次)。
一、Library Preparation文庫的構(gòu)建
1. 利用轉(zhuǎn)座子(transposome)對(duì)雙鏈DNA進(jìn)行剪切以及接頭(adapter)的連接
?
2. 接頭連接成功后,利用低循環(huán)擴(kuò)增技術(shù)在接頭處進(jìn)行修飾,分別在兩端添加sequencing primer binding site1 / sequencing primer binding site2(即測(cè)序引物結(jié)合位點(diǎn))、index1/index2以及我們稱之P5和P7的寡核苷酸序列
下圖是維基百科的示意圖,詳細(xì)一些。
注意:
關(guān)于index,也叫barcodes,因?yàn)橐粋€(gè)lane可以同時(shí)測(cè)多個(gè)樣品,為了避免混淆樣品的read products,每種樣品的DNA由一種index修飾,這樣測(cè)序得到的reads都是具有index標(biāo)記的,在測(cè)序結(jié)果中,依據(jù)之前標(biāo)簽與樣品的對(duì)應(yīng)關(guān)系,就可以獲得對(duì)應(yīng)樣品的數(shù)據(jù)。而這里的index1和index2是為了區(qū)分paired-end測(cè)序得到的雙端reads。
二、Cluster generation 簇生成
1. Flowcell上隨機(jī)分布了兩種不同的寡核苷酸序列,分別與P5互補(bǔ)(即P5’),與P7一致(即P7)。
2. 待測(cè)sequence通過P5與folwcell上的P5’序列雜交互補(bǔ),以待測(cè)sequence為模板進(jìn)行互補(bǔ)鏈(即reverse strand)的延伸,互補(bǔ)鏈的兩端為P5’和P7’。
3.? 接下來模板鏈被切斷并洗下
Reverse strand的P7’與Flowcell上的P7雜交互補(bǔ),進(jìn)行鏈的合成,這就是我們所熟知的橋式PCR
接下來合成的雙鏈被解鏈,再分別與Flowcell上的接頭雜交互補(bǔ),延伸,解鏈,雜交,延伸,解鏈...如此重復(fù)35個(gè)循環(huán)
4. 橋式PCR完成后,使用NAOH將雙鏈解鏈,并利用甲酰胺基嘧啶糖苷酶(Fpg)對(duì)8-氧鳥嘌呤糖苷(8-oxo-G)的選擇性切斷作用,選擇性地將P5’與鏈的連接切斷,留下與Flowcell上P7連接的鏈,也就是Forward strand。同時(shí)游離的3’端被阻斷,防止不必要的DNA延伸
三、測(cè)序
1. 測(cè)序引物(sequencing primer)結(jié)合到靠近P5的測(cè)序引物結(jié)合位點(diǎn)1(sequencing primer binding site 1)上,在系統(tǒng)中加入四種dNTP和DNA聚合酶。這里的dNTP有兩個(gè)特點(diǎn):它是有熒光基團(tuán)標(biāo)記的,每種堿基標(biāo)記的熒光基團(tuán)不一樣;它的3’末端連了一個(gè)疊氮基,這個(gè)疊氮基能夠阻斷后面的堿基與它相連
因此在聚合酶的作用下,與Forward strand相應(yīng)位置堿基配對(duì)的dNTP就會(huì)結(jié)合到新合成的鏈上,而由于疊氮基的存在,后面的dNTP無法繼續(xù)連接。這時(shí)用水將剩余的dNTP和酶給沖掉,將Flowcell進(jìn)行掃描,掃描出來的熒光對(duì)應(yīng)的堿基的配對(duì)堿基即是該鏈該位置的堿基。同時(shí)在這個(gè)Flowcell上有成千上萬個(gè)cluster也在進(jìn)行同樣的反應(yīng),因此一個(gè)循環(huán)就能同時(shí)檢測(cè)多個(gè)樣本(這也是高通量的核心所在)。這個(gè)循環(huán)完成后,加入化學(xué)試劑把疊氮基和標(biāo)記的熒光基團(tuán)切掉,進(jìn)行下一個(gè)循環(huán)(堿基的連接、檢測(cè)與切除)。如此重復(fù)直至所有鏈的堿基序列被檢測(cè)出,也就是Forward read 序列。
2. Index測(cè)序:所有循環(huán)結(jié)束后,read products 被洗掉,index1 primer與鏈上index primer1 結(jié)合位點(diǎn)雜交配對(duì),進(jìn)行index1的合成及檢測(cè)
3. Index1測(cè)序完成后,洗脫測(cè)序產(chǎn)物。此時(shí)機(jī)器已通過熒光得到了index1的序列
4.Index2測(cè)序:Forward strand頂端的P5序列與Flowcell上的P5’雜交配對(duì),進(jìn)行index2測(cè)序。測(cè)序完成后洗脫產(chǎn)物
四、Paried-end sequencing(即對(duì)Reverse strand測(cè)序)
1. 洗脫index2測(cè)序產(chǎn)物后,以Flowcell上的P5’為引物,Forward strand為模板進(jìn)行橋式擴(kuò)增,得到雙鏈
2. NAOH使雙鏈變性為單鏈,并洗去已經(jīng)測(cè)序完成的Forward strand
3.? ?類似的,readprimer2結(jié)合到靠近P7’的read primer binding site 2開始對(duì)Reverse strand的測(cè)序。測(cè)序完成后即可得到Reverse read序列。
前面介紹的都是paired-end的測(cè)序,而single-end測(cè)序方式是只將index,sequencing primer binding site以及P7/P5添加到 fragamented DNA片段的一端,另一端直接連上P5/P7,將片段固定在Flowcell上橋式PCR生成DNA簇,然后單端測(cè)序讀取序列
illumina的官方視頻:
http://v.youku.com/v_show/id_XMTI1MjA5Mzg5Mg==.html?spm=a2h0k.8191407.0.0&from=s1.8-1-1.2
總結(jié)
以上是生活随笔為你收集整理的illumina 双端测序(pair end)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: atom可以做php开发吗,atomco
- 下一篇: 城府