日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

蛋白质组学数据的归一化/标准化处理

發布時間:2023/12/13 综合教程 46 生活家
生活随笔 收集整理的這篇文章主要介紹了 蛋白质组学数据的归一化/标准化处理 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

目錄1.前言2.主要方法及代碼實現3.標準化方法評估4.MaxQuant中的Intensity,LFQ和iBAQ5.資源列表

1.前言

目的:
調整由于技術,如處理、上樣、預分、儀器等造成的樣本間誤差。這實際上是一種數據縮放的方法。一般在一個表達矩陣中,會涉及到多個樣本,其表達量差異比較大,不能直接進行比較。比如某個樣本表達量很大,在總體中就會占據絕對領導地位,這樣就會掩蓋掉表達量小的樣本的作用,但并不代表它不重要,也有可能是這個樣本含有較多的低表達基因,所以需要指定一個統一的標準,提前對樣本原始表達量進行一定的處理。

起源:
處理方法借鑒基因表達數據,如RNAseq和芯片數據。在RNAseq數據中,通常需要消除基因長度、測序量等因素產生的誤差。轉錄組和芯片數據處理相對比較成熟,有現成的方法和工具可用,如RPM/CPM、TPM、RPKM等等。當然蛋白質組數據的標準化也有其獨特的地方,如它主要通過是峰面積來定量的,需要對不同run之間的峰面積進行標準化,這在大部分搜庫軟件中都有處理。

歸一化與標準化的區別:
歸一化是特殊的標準化,在生信領域不嚴格區分。歸一化Normalization一般是把數據縮放到一定范圍,如[0,1], 受離群點影響大;標準化Standardization一般把數據縮放成均值為0,方差為1的狀態,即重新創建一個新的數據分布,受離群點影響小,但變換后的數據邊界不確定。

特點:
消除了量綱(單位)的影響,真正突出數據的差別,有點絕對值變為相對值的感覺。
對指標進行了統一,解決數據性質不同的問題。
標準化后的數據收斂速度更快,計算時間會短很多。

數據縮放scaling(標準化、歸一化)的那些事
表達矩陣的歸一化和標準化,去除極端值,異常值
基因芯片數據分析(一)--芯片數據預處理

2.主要方法及代碼實現

蛋白質組中標準化的工具較少,一般是自己編寫代碼。一般用apply結合sweep函數來實現。

一個表達矩陣,通常行為蛋白,列為不同樣本,我們可以標準化行,也可標準化列,具體問題具體分析,關鍵在于要解釋什么問題。比如我們要盡可能減弱系統偏差對樣本蛋白定量值的影響,使各個樣本和平行實驗的數據處于相同的水平,讓下游分析更為準確可靠,我們需要對列進行歸一化。類似于我們做WB或QPCR實驗時,會選擇內參校正多個樣本的定量值。添加內參或QC的方法在代謝組學的標準化中常用。

前四種方法通過將每個蛋白原始定量值除以對應樣本的某指定值(如平均值、中位數、最大值和總和等)實現校正,每個樣本的指定值在校正后變為1;后三種方法通過一定標準對原始數據進行縮放實現校正。

中位數/均值/總和標準化

sweep(data,2,apply(data,2,median,na.rm=T),FUN="/") #中位數不受數列的極大值或極小值影響。
sweep(data,2,apply(data,2,mean,na.rm=T),FUN=“/”)
sweep(data,2,apply(data,2,sum,na.rm=T),FUN="/")

中心化變換
將每一個數據減去對應列的均值,數據變換后,均值為0,方差不變。中心化以后,由于數據的均值變成0,可以消除量綱、數據自身差異所帶來的影響(此處是做減法而不是除法,所以變量的單位還是保留的),而且對線性回歸以及模型預測方面也有好處。

sweep(data,2,apply(data,2,mean,na,rm=T),FUN="-")

或者直接用scale函數:

scale(data,center=T,scale=F) #center中心化,scale標準化

極差標準化
將每一個數據減去對應列的均值,然后除以對應列最大值與最小值之間的差值。

datacenter <- sweep(data_read,2,apply(data_read,2,mean,na.rm=T),FUN="-")
daraR <- apply(data_read,2,max,na.rm=T) - apply(data_read,2,min,na.rm=T)
sweep(datacenter,2,dataR,FUN="/")

正態標準化
將每一個數據減去對應列的均值,然后除以對應列的標準差,稱之z-score(標準差標準化),其實就是scale函數中的scale參數。

scale(data,center=T,scale=T)

中位數、均值、中心化之類的標準化方法是將數據按照一定的比例進行縮小,但是縮小的范圍是不確定的;而總和標準化、極差標準化、正態標準化之類的標準化方法可以將原始數據縮小到一個很有限的范圍(比如縮小到[0,1]范圍以內),比如有些機器學習方法,是要求對數據做正態標準化的,這種標準化的數據可以保證后續的運算速度更快。

如果要對行進行標準化,要求數據盡量在同一個尺度(scale)下進行比較,比如做層次聚類熱圖,建議將行的數據也進行標準化,這樣每一行的數據就會控制在同一個尺度之下,顏色的深淺能更好地表現出數據的變化趨勢。

http://www.360doc.com/content/19/0628/17/52645714_845432507.shtml

3.標準化方法評估

有一些類似的文章發表,簡單看了下。
以下一篇是綜述,描述了整個蛋白鑒定過程中(包括實驗部分)有可能遇到的標準化處理的過程。
What is Normalization? The Strategies Employed inTop-Down and Bottom-Up Proteome Analysis Workflows

下面一篇文章綜合比較了11種不同歸一化的性能:

variance stabilization normalization(VSN)方法能降低的技術重復間差異最大。Linear regression normalization and local regression normalization的總體效果也不錯。
A systematic evaluation of normalization methods in quantitative label-free proteomics

4.MaxQuant中的Intensity,LFQ和iBAQ

大佬的軟件,三種定量算法都發了文章。

Intensity是將某Protein Groups里面的所有Unique和Razor peptides的信號強度加起來,作為一個原始強度值。用得很少。
iBAQ是在Intenstiy的基礎上,將原始強度值除以本蛋白的理論肽段數目。一般用于樣本內不同蛋白的比較,因為它表征的是蛋白的摩爾比值(copy number)。也可用于不同樣本比較,即通過歸一化手工校準樣本間誤差:蛋白IBAQ值除以此樣品所有蛋白的強度的和,計算比例(這也是組學中“等質量上樣”和“等體積上樣”的核心區別,等質量上樣來看的是比例,但是計算比例是有壓縮效應的)。用得較少。
LFQ則是將原始強度值在樣本之間進行校正,以消除處理、上樣、預分、儀器等造成的樣本間誤差。一般用于同一蛋白不同樣本間的比較。不過我們拿到數據后,我們還是會過濾、填充、轉換、標準化一條龍走一遍。用得最多。

[蛋白組學定量值的比較說明
](https://www.cnblogs.com/yanzhi123/p/11712926.html)

5.資源列表

評估工具Normalyzer
Normalyzer: A Tool for Rapid Evaluation of Normalization Methodsfor Omics Data Sets

其他
Normalization and missing value imputation forlabel-free LC-MS analysis
https://statomics.github.io/pda/assets/2_MSqRob_data_analysisIb.pdf
Comparison of Affymetrix data normalization methods using 6,926 experiments across five array generations

總結

以上是生活随笔為你收集整理的蛋白质组学数据的归一化/标准化处理的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 国产成人无码a区在线观看视频 | 国产精品麻豆一区二区三区 | 五月天福利视频 | 国产噜噜噜噜噜久久久久久久久 | 黄a视频 | 在线观看免费国产视频 | 亚洲天堂一二三 | 亚洲经典自拍 | 99国内揄拍国内精品人妻免费 | 天天躁狠狠躁狠狠躁夜夜躁68 | 久久久高清免费视频 | jizz日本18| 老妇裸体性激交老太视频 | 黄色片在线播放 | 91精品久久久久久久久中文字幕 | 97视频在线观看免费高清完整版在线观看 | 一区二区三区视频免费视 | 久久免费看 | 黄色片网站免费看 | 国产精品有限公司 | 日本一区二区三区在线观看 | 黄色三级小说 | 西欧free性满足hd老熟妇 | 精品人体无码一区二区三区 | 天天操网址 | 亚洲黄色大片 | 亚洲一区二区在线观看视频 | 亚洲国产精品无码久久久 | 一区二区三区中文视频 | 国产噜噜噜 | 中文字幕精品视频 | 国产亚洲视频在线观看 | 国产色影院 | 一区二区三区在线免费观看视频 | 免费麻豆视频 | 欧美va天堂| 成年人精品视频 | 中文字幕免 | 天天看片天天干 | 男生尿隔着内裤呲出来视频 | 爱插美女网 | 日本理论片 | 日韩一区二区三区四区五区六区 | 日韩一级特黄 | 精产国品一二三区 | 深夜福利一区二区 | 欧美性猛交99久久久久99按摩 | 久久久久久国产视频 | 国产字幕av | 5个黑人躁我一个视频 | 好吊视频一区二区 | 亚洲精品久久久久久无码色欲四季 | 欧美精品日韩少妇 | 国产精品国产精品国产专区 | www.亚洲一区二区三区 | 国产精品主播 | 草青青视频| 美女91网站 | ,午夜性刺激免费看视频 | 国产免费av网站 | 精品人妻一区二区三区麻豆91 | 日韩专区视频 | 浪潮av一区二区三区 | 男女做那个视频 | 亚洲国产视频一区二区三区 | 国产精品自拍99 | 亚洲一区在线视频观看 | 一级草逼片 | 九色蝌蚪91| 成人网久久 | 国产精品一区二区亚洲 | 西西人体高清44rt·net | 亚洲黄色短视频 | 久久久久国产精品无码免费看 | 外国电影免费观看高清完整版 | 涩涩视频在线观看 | 亚洲成人一区二区 | 影音先锋三级 | 午夜视频在线网站 | 自拍偷拍av| 国产伦精品一区二区三区88av | 欧美另类自拍 | 看全色黄大色黄大片大学生 | 欧美一级黄色片网站 | 婷婷五月在线视频 | 麻豆疯狂做受xxxx高潮视频 | 亚洲国产福利 | 久久欧洲| 日韩欧美不卡视频 | 91av欧美| 夜夜爽日日澡人人添 | 妹子色综合 | 我们好看的2018视频在线观看 | 国产激情一区二区三区视频免樱桃 | 日本韩国欧美 | 久久亚洲电影 | 欧美xxx在线观看 | 国产女主播一区 | 爱爱综合 |