日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

衡量基因相对表达量的RPKM、FPKM、TPM详解

發(fā)布時(shí)間:2023/12/8 编程问答 44 豆豆
生活随笔 收集整理的這篇文章主要介紹了 衡量基因相对表达量的RPKM、FPKM、TPM详解 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

衡量基因相對(duì)表達(dá)量的RPKM和FPKM、及TPM

1.RPKM(Reads Per Kilobase per Million)和FPKM(Fragments Per Kilobase per Million)

1.引入“每一千堿基(per kilobase)”的原因在于,不同的RNA可能有不同長(zhǎng)度,長(zhǎng)度越長(zhǎng),對(duì)應(yīng)的reads就越多。當(dāng)每個(gè)RNA都除以自身長(zhǎng)度(以1000堿基,即kb為單位)時(shí),就可以比較同一個(gè)樣本中不同基因的相對(duì)表達(dá)量了。
2.引入“每一百萬(wàn)reads”的原因是,不同的樣本可能測(cè)序的深度不一樣,深度越深,當(dāng)然對(duì)應(yīng)的reads就越多了。如果結(jié)果除以各自庫(kù)的數(shù)量(以一百萬(wàn)reads為單位),那么我們就能很好地衡量?jī)蓚€(gè)不同樣本中同一個(gè)基因的相對(duì)表達(dá)量。

計(jì)算方法

第一步先將測(cè)序深度標(biāo)準(zhǔn)化,計(jì)算方法很簡(jiǎn)單,先分別計(jì)算出每個(gè)樣本的總reads數(shù),然后將表中數(shù)據(jù)分別除以總reads數(shù)即可,這樣就得到了reads per million。

第二步是基因長(zhǎng)度的標(biāo)準(zhǔn)化。將第一步的read per million直接除以基因長(zhǎng)度即可。

FPKM和RPKM的定義是相同的,唯一的區(qū)別是FPKM適用于雙端測(cè)序文庫(kù),而RPKM適用于單端測(cè)序文庫(kù)。是衡量基因相對(duì)表達(dá)量的一個(gè)公式,

RPKM是將Map到基因的Reads數(shù)除以Map到Genome的所有Read數(shù)(以Million為單位)與RNA的長(zhǎng)度(以KB為單位),是衡量基因相對(duì)表達(dá)量的一個(gè)公式,適用于單端測(cè)序

FPKM是將Map到基因的Fragments數(shù)除以Map到Genome的所有Read數(shù)(以Million為單位)與RNA的長(zhǎng)度(以KB為單位)。適用于單端和雙端測(cè)序。
它們2者的不同:
在single-end(單端測(cè)序)測(cè)序中,FPKM將read當(dāng)做fragment計(jì)算,此時(shí)FPKM和RPKM是相同的。
而在pair-end(雙端測(cè)序)測(cè)序 中, 若一堆paired-read 都比對(duì)上了,當(dāng)做一個(gè)fragment。

TPM:Transcripts Per Kilobase per Million mapped reads (每千個(gè)堿基的轉(zhuǎn)錄每百萬(wàn)映射讀取的Transcripts):它先對(duì)每個(gè)基因的read數(shù)用基因的長(zhǎng)度進(jìn)行校正,之后再用校正后的這個(gè)基因read數(shù)(nr/Lr)與校正后的這個(gè)樣本的所有校正后的read數(shù)(sum( nr/Lr+………+ nm/Lm ))求商,是衡量基因相對(duì)表達(dá)量的一個(gè)手段
TPM的出現(xiàn):
TPM的不同在于它的處理順序是不同的。即先考慮基因長(zhǎng)度,再考慮測(cè)序深度。
它的好處是,上邊FPKM:
FPKM = (10^6 * nf) / (L * N)
其中:
nf 代表比對(duì)至目標(biāo)基因的fragment數(shù)量;
L代表目標(biāo)基因的外顯子長(zhǎng)度之和除以1000,單位是Kb;
N是總的有效比對(duì)至基因組的fragment數(shù)量。
FPKM中N同樣會(huì)受到各個(gè)轉(zhuǎn)錄基因長(zhǎng)度(distribution of transcript lengths)的影響,也就是說(shuō):FPKM/RPKM是不準(zhǔn)確的。而TPM在一個(gè)樣本中一個(gè)基因的TPM:先對(duì)每個(gè)基因的read數(shù)用基因的長(zhǎng)度進(jìn)行校正,之后再用校正后的這個(gè)基因read數(shù)(nr/Lr)與校正后的這個(gè)樣本的所有校正后的read數(shù)(sum( nr/Lr+………+ nm/Lm ))求商。TPM除以經(jīng)過(guò)基因長(zhǎng)度歸一化后的有效比對(duì)的read總數(shù),即歸一化后的測(cè)序深度。
————————————————

楊夢(mèng)磊
20211024

總結(jié)

以上是生活随笔為你收集整理的衡量基因相对表达量的RPKM、FPKM、TPM详解的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。