转录组表达量计RPKM、FPKM、TPM说明
在轉錄組測序(RNA-Seq)中,基因的表達量是我們關注的重點?;虮磉_量的衡量指標有:RPKM、FPKM、TPM。
RPKM:Reads Per Kilobase Million;說實話,這個英文說明真的很費解,其實可以理解為“Reads Per Kilobase Per Million Reads”?,即“每一百萬條Reads中,對基因的每1000個Base而言,比對到該1000個base的Reads數”,計算公式。
FPKM:Fragments per Kilobase Million,FPKM意義與RPKM極為相近。二者區別僅在于,Fragment 與 Read。RPKM的誕生是針對早期的SE測序,FPKM則是在PE測序上對RPKM的校正。只要明確?Reads 和 Fragments的區別,RPKM和FPKM的概念便易于區分。Reads即是指下機后fastq數據中的每一條Reads,Fragments則是指每一段用于測序的核酸片段,在SE中,一個Fragments只測一條Reads,所以,Reads數與Fragments數目相等;在PE中,一個Fragments測兩端,會得到2條Reads,但由于后期質量或比對的過濾,有可能一個Fragments的2條Reads最后只有一條進入最后的表達量分析??傊?,對某一對Reads而言,這2條Reads只能算一個Fragments,所以,Fragment的最終數目是Reads的1到2倍之間。
TPM:?Transcripts Per Million,這個英文也很費解。先不糾結字面意思了,直接解釋它的計算方法。TPM的計算分3步:
step1:根據基因/轉錄本長度?校正count值;假設某基因count值為R1,則校正后count值為:
R1/(L1/1000)?;
注: L1為該基因的長度;
step2:計算total 校正后count值;即所有基因的校正后count值?總和,Rtotal;
step3:計算TPM;TPM?結果為:
R1*1000*1000000/(L1*?Rtoatl)。
總結
以上是生活随笔為你收集整理的转录组表达量计RPKM、FPKM、TPM说明的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 什么是数据埋点?
- 下一篇: Linux自动同步时间的方法