衡量基因相对表达量的RPKM、FPKM、TPM详解
衡量基因相對(duì)表達(dá)量的RPKM和FPKM、及TPM
1.RPKM(Reads Per Kilobase per Million)和FPKM(Fragments Per Kilobase per Million)
1.引入“每一千堿基(per kilobase)”的原因在于,不同的RNA可能有不同長(zhǎng)度,長(zhǎng)度越長(zhǎng),對(duì)應(yīng)的reads就越多。當(dāng)每個(gè)RNA都除以自身長(zhǎng)度(以1000堿基,即kb為單位)時(shí),就可以比較同一個(gè)樣本中不同基因的相對(duì)表達(dá)量了。
2.引入“每一百萬(wàn)reads”的原因是,不同的樣本可能測(cè)序的深度不一樣,深度越深,當(dāng)然對(duì)應(yīng)的reads就越多了。如果結(jié)果除以各自庫(kù)的數(shù)量(以一百萬(wàn)reads為單位),那么我們就能很好地衡量?jī)蓚€(gè)不同樣本中同一個(gè)基因的相對(duì)表達(dá)量。
計(jì)算方法
第一步先將測(cè)序深度標(biāo)準(zhǔn)化,計(jì)算方法很簡(jiǎn)單,先分別計(jì)算出每個(gè)樣本的總reads數(shù),然后將表中數(shù)據(jù)分別除以總reads數(shù)即可,這樣就得到了reads per million。
第二步是基因長(zhǎng)度的標(biāo)準(zhǔn)化。將第一步的read per million直接除以基因長(zhǎng)度即可。
FPKM和RPKM的定義是相同的,唯一的區(qū)別是FPKM適用于雙端測(cè)序文庫(kù),而RPKM適用于單端測(cè)序文庫(kù)。是衡量基因相對(duì)表達(dá)量的一個(gè)公式,
RPKM是將Map到基因的Reads數(shù)除以Map到Genome的所有Read數(shù)(以Million為單位)與RNA的長(zhǎng)度(以KB為單位),是衡量基因相對(duì)表達(dá)量的一個(gè)公式,適用于單端測(cè)序
FPKM是將Map到基因的Fragments數(shù)除以Map到Genome的所有Read數(shù)(以Million為單位)與RNA的長(zhǎng)度(以KB為單位)。適用于單端和雙端測(cè)序。
它們2者的不同:
在single-end(單端測(cè)序)測(cè)序中,FPKM將read當(dāng)做fragment計(jì)算,此時(shí)FPKM和RPKM是相同的。
而在pair-end(雙端測(cè)序)測(cè)序 中, 若一堆paired-read 都比對(duì)上了,當(dāng)做一個(gè)fragment。
TPM:Transcripts Per Kilobase per Million mapped reads (每千個(gè)堿基的轉(zhuǎn)錄每百萬(wàn)映射讀取的Transcripts):它先對(duì)每個(gè)基因的read數(shù)用基因的長(zhǎng)度進(jìn)行校正,之后再用校正后的這個(gè)基因read數(shù)(nr/Lr)與校正后的這個(gè)樣本的所有校正后的read數(shù)(sum( nr/Lr+………+ nm/Lm ))求商,是衡量基因相對(duì)表達(dá)量的一個(gè)手段
TPM的出現(xiàn):
TPM的不同在于它的處理順序是不同的。即先考慮基因長(zhǎng)度,再考慮測(cè)序深度。
它的好處是,上邊FPKM:
FPKM = (10^6 * nf) / (L * N)
其中:
nf 代表比對(duì)至目標(biāo)基因的fragment數(shù)量;
L代表目標(biāo)基因的外顯子長(zhǎng)度之和除以1000,單位是Kb;
N是總的有效比對(duì)至基因組的fragment數(shù)量。
FPKM中N同樣會(huì)受到各個(gè)轉(zhuǎn)錄基因長(zhǎng)度(distribution of transcript lengths)的影響,也就是說(shuō):FPKM/RPKM是不準(zhǔn)確的。而TPM在一個(gè)樣本中一個(gè)基因的TPM:先對(duì)每個(gè)基因的read數(shù)用基因的長(zhǎng)度進(jìn)行校正,之后再用校正后的這個(gè)基因read數(shù)(nr/Lr)與校正后的這個(gè)樣本的所有校正后的read數(shù)(sum( nr/Lr+………+ nm/Lm ))求商。TPM除以經(jīng)過(guò)基因長(zhǎng)度歸一化后的有效比對(duì)的read總數(shù),即歸一化后的測(cè)序深度。
————————————————
楊夢(mèng)磊
20211024
總結(jié)
以上是生活随笔為你收集整理的衡量基因相对表达量的RPKM、FPKM、TPM详解的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Unity用代码批量修复材质球shade
- 下一篇: 汉语编程语言构想