对链特异性建库的理解
剛接觸高通量測序的時候就知道有鏈特異性建庫這么個概念,當(dāng)時也了解可以利用加U法,但是沒有思考其中的細(xì)節(jié)。最近把這個概念掰開了揉碎了好好理解,終于填上了這個坑。
正式講之前,有幾個概念是要明確的。
DNA 的正鏈和負(fù)鏈,就是那兩條反向互補(bǔ)的鏈。參考基因組給出的那個鏈就是所謂的正鏈(forword),另一條鏈?zhǔn)欠存?#xff08;reverse)。但是這正反一定不能和正義鏈(sense strand)反義鏈(antisense strand)混淆。
正義鏈(sense strand):兩條互補(bǔ)的DNA鏈其中一條攜帶編碼蛋白質(zhì)信息的鏈稱為正義鏈,又稱編碼鏈,因為它的序列與mRNA相同。
反義鏈(antisense strand):另一條與之互補(bǔ)的稱為反義鏈。而反義鏈雖然和RNA反向互補(bǔ),但它可是真正給RNA當(dāng)模板的鏈,因此反義鏈也是模板鏈。
要注意的是:在一條包含有若干基因的雙鏈DNA分子中,各個基因的正義鏈并不都是在同一條鏈上。
也就是說,有的基因的正義鏈?zhǔn)钦?#xff08;forword strand),有的基因的正義鏈?zhǔn)欠存?#xff08;reverse strand)。所以,DNA雙鏈中的一條鏈對某些基因來說是正義鏈,對另一些基因來說則是反義鏈
總結(jié)兩點
正義鏈(sense strand)= 編碼鏈(coding strand)= 非模板鏈
forword strand 上可以同時有sense strand 和 antisense strand。因為這完全是兩個不同的概念
下面通過這張建庫示意圖來看看普通RNA-Seq建庫和鏈特異性建庫的差異在什么地方
首先說說普通的RNA-Seq建庫方式:它是在RNA逆轉(zhuǎn)錄成雙鏈cDNA的兩端,對稱地加上了兩個Y型的接頭,然后變成文庫。它有一個缺點,就是它是以雙鏈DNA進(jìn)行測序。所以測完序后,我們無法知道測出來的reads是來自正鏈還是負(fù)鏈。
而鏈特異性建庫(以圖中間的dUTP方法為例)則是首先利用隨機(jī)引物合成RNA的一條cDNA鏈,在合成第二條鏈的時候用dUTP代替dTTP,加adaptor后用UDGase處理,將有U的第二條cDNA降解掉。降解發(fā)生之后,雙鏈的文庫就只剩下了一條鏈(負(fù)鏈)。而這條鏈的兩頭是接的不同序列的接頭。通過PCR擴(kuò)增,最終只保留了第一條cDNA(負(fù)鏈)上級測序。這樣最后的insert DNA fragment都是來自于第一條cDNA(負(fù)鏈),也就是dUTP叫fr-firststrand的原因。在測序的過程中先測得正鏈reads,再測得負(fù)鏈reads(能區(qū)分正負(fù)鏈reads,這就是和普通建庫最根本的不同)。在這些reads比對到參考基因組時,那些比對到基因方向(正義鏈方向)的正鏈reads就是正義鏈reads,但是那些比對到基因方向反方向(反義鏈方向)的正鏈reads就是反義鏈reads。那么同樣,比對到基因方向的負(fù)鏈reads就是正義鏈reads,而比對到基因方向反方向(反義鏈方向)的負(fù)鏈reads就是反義鏈reads。從而最終將所有正義鏈reads和反義鏈reads區(qū)分開來。因此在確定基因表達(dá)水平時,可以避免基因反義鏈上的reads匹配的干擾,從而更加準(zhǔn)確的檢測基因轉(zhuǎn)錄表達(dá)水平。而且LncRNA的測序也離不開鏈特異性建庫技術(shù)。原因有三:
1)lncRNA的來源是具有鏈特異性的;
2)lncRNA來源就是編碼蛋白(mRNA)?基因的反義鏈,是傳說中的天然反義lncRNA(NAT-antisense lncRNA);如果是普通非鏈特異性建庫,那么序列是來自mRNA,還是NAT-antisence LncRNA就難以區(qū)分了;
3)?鏈特異性建庫可更準(zhǔn)確地統(tǒng)計轉(zhuǎn)錄本的數(shù)量和確定基因的結(jié)構(gòu),準(zhǔn)確區(qū)分獲得的轉(zhuǎn)錄本來自基因組哪條鏈。?
總結(jié)
以上是生活随笔為你收集整理的对链特异性建库的理解的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 套路(Jony J)
- 下一篇: SOPC教学笔记01——绪论