遗传所屠强研究组开发Decode-seq方法显著提高差异表达基因分析的准确性
轉(zhuǎn)錄組分析的正確姿勢(shì)(第三版)前言
NGS系列文章包括NGS基礎(chǔ)、轉(zhuǎn)錄組分析?(Nature重磅綜述|關(guān)于RNA-seq你想知道的全在這)、ChIP-seq分析?(ChIP-seq基本分析流程)、單細(xì)胞測(cè)序分析?(重磅綜述:三萬字長文讀懂單細(xì)胞RNA測(cè)序分析的最佳實(shí)踐教程 (原理、代碼和評(píng)述))、DNA甲基化分析、重測(cè)序分析、GEO數(shù)據(jù)挖掘(典型醫(yī)學(xué)設(shè)計(jì)實(shí)驗(yàn)GEO數(shù)據(jù)分析 (step-by-step) - Limma差異分析、火山圖、功能富集)等內(nèi)容。
鑒定差異表達(dá)基因是許多生物醫(yī)學(xué)研究項(xiàng)目的基礎(chǔ)步驟,利用轉(zhuǎn)錄組進(jìn)行差異表達(dá)(Differential Expression, DE)分析是目前最主流的方法,得到了廣泛應(yīng)用。例如,兩個(gè)常用于轉(zhuǎn)錄組DE分析的算法 edgeR 和 DESeq2 已經(jīng)被引用了超過上萬次。
在DE分析中,如果使用的生物學(xué)重復(fù)數(shù)不足,會(huì)影響到結(jié)果的準(zhǔn)確性,生物統(tǒng)計(jì)學(xué)家們長期以來呼吁要提高重復(fù)數(shù)。然而,由于傳統(tǒng)轉(zhuǎn)錄組方法的實(shí)驗(yàn)流程較為復(fù)雜昂貴,大多數(shù)研究?jī)H使用 2-3 對(duì)生物學(xué)重復(fù)。使用這么少重復(fù)數(shù)的分析,敏感性(sensitivity)較低,只有差異表達(dá)最顯著的基因才能被鑒定出來;錯(cuò)誤發(fā)現(xiàn)率(FDR)也很高,結(jié)果中存在大量的假陽性。因此,需要一種新的實(shí)驗(yàn)方法,有效解決生物學(xué)重復(fù)不足的問題,提高DE分析的準(zhǔn)確性。【生物重復(fù)對(duì)差異基因鑒定的影響評(píng)估見本次推文次條】
中國科學(xué)院遺傳與發(fā)育生物學(xué)研究所屠強(qiáng)研究組開發(fā)了一種新的轉(zhuǎn)錄組實(shí)驗(yàn)方法,稱為Decode-seq。該方法利用多種分子標(biāo)簽,可以在一個(gè)測(cè)序文庫中同時(shí)檢測(cè)數(shù)十個(gè)樣品,大幅降低了建庫成本;富集轉(zhuǎn)錄本5’端測(cè)序,相比全長測(cè)序降低了測(cè)序成本,也避免了3‘端測(cè)序造成的困難;文庫結(jié)構(gòu)兼容通用測(cè)序流程,不需要定制參數(shù),可以與任意標(biāo)準(zhǔn)文庫同時(shí)上機(jī),因此對(duì)測(cè)序量要求也非常靈活。與傳統(tǒng)轉(zhuǎn)錄組方法相比,Decode-seq的成本降低到約10%,非常適用于大規(guī)模的DE分析。在驗(yàn)證實(shí)驗(yàn)中,使用30對(duì)重復(fù)的DE分析結(jié)果相對(duì)于3對(duì)重復(fù),敏感性從31% 提高到 95%,錯(cuò)誤發(fā)現(xiàn)率從 34% 降低到 14%,顯著改善了結(jié)果的準(zhǔn)確性。Decode-seq 方法還可以應(yīng)用于微量樣品,例如對(duì)青鳉魚發(fā)育早期的雌雄性腺進(jìn)行多達(dá)30對(duì)重復(fù)的轉(zhuǎn)錄組分析,鑒定出了多個(gè)雌雄差異表達(dá)基因,其中一些被證明對(duì)生殖細(xì)胞的正常發(fā)育是必須的。
綜合這些結(jié)果可知,大幅增加生物學(xué)重復(fù)可以顯著提高差異表達(dá)基因鑒定的準(zhǔn)確性,而Decode-seq 為此提供了一個(gè)可行的實(shí)驗(yàn)方法。因此,除非因樣品珍貴、需要研究轉(zhuǎn)錄本全長等原因,否則應(yīng)避免僅使用2-3對(duì)生物學(xué)重復(fù)的轉(zhuǎn)錄組分析策略。Decode-seq 方法的實(shí)驗(yàn)流程和分析程序都已經(jīng)在研究組主頁(https://github.com/QTuLab)上提供下載。
該成果于2020年3月23日正式發(fā)表于 Genome Biology 雜志(DOI:10.1186/s13059-020-01966-9),文章標(biāo)題為“Decode-seq: a practical approach to improve differential gene expression analysis”。屠強(qiáng)研究組博士研究生李瑩姝為該論文的第一作者,屠強(qiáng)研究員為該論文的通訊作者。該研究得到國家自然基金和中科院先導(dǎo)項(xiàng)目的資助。
圖:(a-b) 使用3對(duì)和30對(duì)重復(fù)的驗(yàn)證實(shí)驗(yàn),紅色為真陽性,黃色為假陽性,灰色為真陰性,藍(lán)色為假陰性。? 對(duì)30對(duì)重復(fù)的結(jié)果進(jìn)行抽樣計(jì)算表明,隨著重復(fù)數(shù)的增加,差異基因鑒定的準(zhǔn)確性也得到了大幅提高。
總結(jié)
以上是生活随笔為你收集整理的遗传所屠强研究组开发Decode-seq方法显著提高差异表达基因分析的准确性的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 机器学习算法-随机森林之决策树R 代码从
- 下一篇: 高通量数据中批次效应的鉴定和处理(三)-