日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

高通量数据中批次效应的鉴定和处理(一)

發布時間:2025/3/15 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 高通量数据中批次效应的鉴定和处理(一) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

生物信息學習的正確姿勢

NGS系列文章包括NGS基礎、轉錄組分析?(Nature重磅綜述|關于RNA-seq你想知道的全在這)、ChIP-seq分析?(ChIP-seq基本分析流程)、單細胞測序分析?(重磅綜述:三萬字長文讀懂單細胞RNA測序分析的最佳實踐教程 (原理、代碼和評述))、DNA甲基化分析、重測序分析、GEO數據挖掘(典型醫學設計實驗GEO數據分析 (step-by-step) - Limma差異分析、火山圖、功能富集)等內容。

什么是批次效應?

批次效應表示樣品在不同的批次處理和測量時引入的與生物狀態不相關的系統性的技術偏差。很多因素都可能導致批次效應的產生,如不同實驗條件、不同操作者、不同公司的試劑、不同批的試劑、實驗開展的時間、檢測設備、不同的測序批次等。

批次效應會有什么影響?

2014年生信領域的大牛Michael P Snyder在PNAS上發表了一篇文章Comparison of the transcriptional landscapes between human and mouse tissues,比較了人和小鼠不同組織和器官中表達譜的異同。研究發現不同物種之間組織特異表達的基因是一致的,但很多基因在同一物種不同組織的表達相似度大于它們在不同物種同一組織的表達相似度。“我”來引申下 (原文并沒有這么直接說),大體可以理解為小鼠的腦與小鼠的腎臟的相似性大于小鼠的腦與人的腦的相似性。“我”得出的這個結論是有一些顛覆認知的,如果這樣,用小鼠做為模式動物是否會對人的研究給出相似性的推導?

這篇PNAS文章發出后,芝加哥大學的Yoav Gilad在F1000上發表了一篇文章A reanalysis of mouse ENCODE comparative gene expression data來討論這個不同于以往認知的研究項目的設計和分析的合理性。

首先作者從FASTQ數據的序列名字的ID中提取出對應測序數據來源的測序儀設備ID和測序通道信息,發現所有數據來源于5個批次,如下圖所示,只有最后一個批次同時包含了人和小鼠的器官,其它批次都只包含了人的器官或小鼠的器官。

重現者Yoav Gilad等通過對數據進行重分析,重現了類似于原文中的結果。不論是PCA還是Heatmap的結果,都展示出來源于同一物種的組織或器官傾向于聚類到一起。

重現者Yoav Gilad等采用ComBat移除批次帶來的影響,再次繪制PCA和Heatmap,結果顯示表達譜按組織類型而非物種聚在了一起。

大家有興趣可以在https://f1000research.com/articles/4-121看看Yoav Gilad的具體操作和PNAS一作Yoav Gilad等人的討論,通過學習雙方在這段公案中辯論的出發點和落腳點,相信對數據分析也會有更多認識,這個我們后續也會涉及。

未完待續......

很長一段時間精力有限,我親自寫的或修改的文章沒有幾篇,公眾號疏于打理,有很多對不住大家的地方。最近堅持多投入一些,分段寫一部分,發一部分,也歡迎大家一起討論,指出問題,提出問題,解決問題,共同進步。

往期精品(點擊圖片直達文字對應教程)

后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集

總結

以上是生活随笔為你收集整理的高通量数据中批次效应的鉴定和处理(一)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。