當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

illumina 双端测序（pair end）

發(fā)布時(shí)間：2023/12/8 编程问答 61 豆豆

生活随笔收集整理的這篇文章主要介紹了 illumina 双端测序（pair end）小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

本文來自 sixu_9days 的CSDN 博客：https://blog.csdn.net/sixu_9days/article/details/78948914

illumina測(cè)序的核心在于利用可逆終止的、熒光標(biāo)記的dNTP進(jìn)行邊合成邊測(cè)序（Sequencing-By-Synthesis,SBS）

Flowcell（流動(dòng)池）是有著2個(gè)或8個(gè)lane（泳道）的玻璃板，每個(gè)lane可以測(cè)一個(gè)樣本或者多樣本的混合物，且隨機(jī)布滿了能夠與文庫兩端接頭分別互補(bǔ)配對(duì)或一致的寡核苷酸（oligos，P7和P5接頭）。一個(gè)lane包含兩列，每一列有60個(gè)tile，每個(gè)tile會(huì)種下不同的cluster，每個(gè)tile在一次循環(huán)中會(huì)拍照4次（每個(gè)堿基一次）。

一、Library Preparation文庫的構(gòu)建

1. 利用轉(zhuǎn)座子（transposome）對(duì)雙鏈DNA進(jìn)行剪切以及接頭（adapter）的連接

2. 接頭連接成功后，利用低循環(huán)擴(kuò)增技術(shù)在接頭處進(jìn)行修飾，分別在兩端添加sequencing primer binding site1 / sequencing primer binding site2（即測(cè)序引物結(jié)合位點(diǎn)）、index1/index2以及我們稱之P5和P7的寡核苷酸序列

下圖是維基百科的示意圖，詳細(xì)一些。

注意：

P5和P7是不同的，它們分別和flowcell上的接頭互補(bǔ)和相同。為了方便闡述，將與P5互補(bǔ)的接頭稱為P5’，與P7互補(bǔ)的接頭稱為P7’。

index1和index2也是不同的，與P5相連的是index2，與P7相連的是index1

關(guān)于index，也叫barcodes，因?yàn)橐粋€(gè)lane可以同時(shí)測(cè)多個(gè)樣品，為了避免混淆樣品的read products，每種樣品的DNA由一種index修飾，這樣測(cè)序得到的reads都是具有index標(biāo)記的，在測(cè)序結(jié)果中，依據(jù)之前標(biāo)簽與樣品的對(duì)應(yīng)關(guān)系，就可以獲得對(duì)應(yīng)樣品的數(shù)據(jù)。而這里的index1和index2是為了區(qū)分paired-end測(cè)序得到的雙端reads。

二、Cluster generation 簇生成

1. Flowcell上隨機(jī)分布了兩種不同的寡核苷酸序列，分別與P5互補(bǔ)（即P5’），與P7一致（即P7）。

2. 待測(cè)sequence通過P5與folwcell上的P5’序列雜交互補(bǔ)，以待測(cè)sequence為模板進(jìn)行互補(bǔ)鏈（即reverse strand）的延伸，互補(bǔ)鏈的兩端為P5’和P7’。

3.? 接下來模板鏈被切斷并洗下

Reverse strand的P7’與Flowcell上的P7雜交互補(bǔ)，進(jìn)行鏈的合成，這就是我們所熟知的橋式PCR

接下來合成的雙鏈被解鏈，再分別與Flowcell上的接頭雜交互補(bǔ)，延伸，解鏈，雜交，延伸，解鏈...如此重復(fù)35個(gè)循環(huán)

4. 橋式PCR完成后，使用NAOH將雙鏈解鏈，并利用甲酰胺基嘧啶糖苷酶（Fpg）對(duì)8-氧鳥嘌呤糖苷（8-oxo-G）的選擇性切斷作用，選擇性地將P5’與鏈的連接切斷，留下與Flowcell上P7連接的鏈，也就是Forward strand。同時(shí)游離的3’端被阻斷，防止不必要的DNA延伸

三、測(cè)序

1. 測(cè)序引物（sequencing primer）結(jié)合到靠近P5的測(cè)序引物結(jié)合位點(diǎn)1（sequencing primer binding site 1）上，在系統(tǒng)中加入四種dNTP和DNA聚合酶。這里的dNTP有兩個(gè)特點(diǎn)：它是有熒光基團(tuán)標(biāo)記的，每種堿基標(biāo)記的熒光基團(tuán)不一樣；它的3’末端連了一個(gè)疊氮基，這個(gè)疊氮基能夠阻斷后面的堿基與它相連

因此在聚合酶的作用下，與Forward strand相應(yīng)位置堿基配對(duì)的dNTP就會(huì)結(jié)合到新合成的鏈上，而由于疊氮基的存在，后面的dNTP無法繼續(xù)連接。這時(shí)用水將剩余的dNTP和酶給沖掉，將Flowcell進(jìn)行掃描，掃描出來的熒光對(duì)應(yīng)的堿基的配對(duì)堿基即是該鏈該位置的堿基。同時(shí)在這個(gè)Flowcell上有成千上萬個(gè)cluster也在進(jìn)行同樣的反應(yīng)，因此一個(gè)循環(huán)就能同時(shí)檢測(cè)多個(gè)樣本（這也是高通量的核心所在）。這個(gè)循環(huán)完成后，加入化學(xué)試劑把疊氮基和標(biāo)記的熒光基團(tuán)切掉，進(jìn)行下一個(gè)循環(huán)（堿基的連接、檢測(cè)與切除）。如此重復(fù)直至所有鏈的堿基序列被檢測(cè)出，也就是Forward read 序列。

2. Index測(cè)序：所有循環(huán)結(jié)束后，read products 被洗掉，index1 primer與鏈上index primer1 結(jié)合位點(diǎn)雜交配對(duì)，進(jìn)行index1的合成及檢測(cè)

3. Index1測(cè)序完成后，洗脫測(cè)序產(chǎn)物。此時(shí)機(jī)器已通過熒光得到了index1的序列

4.Index2測(cè)序：Forward strand頂端的P5序列與Flowcell上的P5’雜交配對(duì)，進(jìn)行index2測(cè)序。測(cè)序完成后洗脫產(chǎn)物

四、Paried-end sequencing（即對(duì)Reverse strand測(cè)序）

1. 洗脫index2測(cè)序產(chǎn)物后，以Flowcell上的P5’為引物，Forward strand為模板進(jìn)行橋式擴(kuò)增，得到雙鏈

2. NAOH使雙鏈變性為單鏈，并洗去已經(jīng)測(cè)序完成的Forward strand

3.? ?類似的，readprimer2結(jié)合到靠近P7’的read primer binding site 2開始對(duì)Reverse strand的測(cè)序。測(cè)序完成后即可得到Reverse read序列。

前面介紹的都是paired-end的測(cè)序，而single-end測(cè)序方式是只將index，sequencing primer binding site以及P7/P5添加到 fragamented DNA片段的一端，另一端直接連上P5/P7，將片段固定在Flowcell上橋式PCR生成DNA簇，然后單端測(cè)序讀取序列

illumina的官方視頻：

http://v.youku.com/v_show/id_XMTI1MjA5Mzg5Mg==.html?spm=a2h0k.8191407.0.0&from=s1.8-1-1.2

總結(jié)

以上是生活随笔為你收集整理的illumina 双端测序（pair end）的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： atom可以做php开发吗,atomco
下一篇：城府