日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

RNA-Seq分析|RPKM, FPKM, TPM, 计算对比

發布時間:2023/12/13 综合教程 57 生活家
生活随笔 收集整理的這篇文章主要介紹了 RNA-Seq分析|RPKM, FPKM, TPM, 计算对比 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

在分析了若干轉錄組之后發現,處理數據的時候最重要的不是技巧多么絢麗,你調包的能力有多么強。而是把基本的概念特別是統計和數學上的方法咬爛嚼吐,才是真正理解和掌握了分析數據的底層原理:

在RNA-Seq的分析中,對基因或轉錄本的read counts數目進行normalization是一個extremely essential的過程,因為落在一個基因區域內的read counts數目取決于基因長度和測序深度。

Thats to say,一個基因越長,測序深度越高,落在其內部的read counts數目就會相對越多。

所以DE時,往往是在多個樣本(樣本來自不同組織、不同器官、不同個體、甚至做進化數據的時候是不同物種)中比較不同基因的表達量,如果不進行數據標準化,比較結果是沒有意義的。

Therefore,我們需要標準化的two key factors 就是基因長度和測序深度,常常用RPKM (Reads Per Kilobase Million), FPKM (Fragments Per Kilobase Million) 和 TPM (Trans Per Million)作為標準化數值,前兩者都是DESeq2 package中的funcitons。但是實踐證明,在樣本差異過大或者需要更加精準的比較或者定量目標基因的表達量的時候,還是TPM最為準確和有效。

來源于YouTube的一張示意圖:

1、2、3樣本total reads=35、45、106

RPKM=10/35/2=1.43(如下圖所示)

而TPM的有效性在于它的處理基因測序的深度和長度的順序是不同的。

即先考慮基因長度,再是測序深度:

最后算出來的TPM=3.33

而再比對一下最后結果的total after normalized reads

RPKM:

TPM:

當我們看到這個結果的時候,就應該馬上想到每個樣本的TPM的總和是相同的,這就意味著TPM數值能體現出certain樣本比對上target基因的reads的比例,而這個比例的總和在不同樣本之間是相同的,所以可以使得該數值可以直接進行樣本間的比較。

總結

以上是生活随笔為你收集整理的RNA-Seq分析|RPKM, FPKM, TPM, 计算对比的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。