MDR的进阶版本-GMDR
歡迎關(guān)注”生信修煉手冊(cè)”!
MDR多因子降維法作為邏輯回歸的一種補(bǔ)充,有效克服了邏輯回歸在處理高階稀疏數(shù)據(jù)時(shí)的局限性,廣泛應(yīng)用于分析基因-基因,基因-環(huán)境之間的相互作用,但是該方法存在一些局限性
和邏輯回歸一樣,該方法僅適用于二分類因變量的分析,比如case/control的實(shí)驗(yàn)設(shè)計(jì),對(duì)于連續(xù)型因變量無(wú)法處理
和邏輯回歸不同,邏輯回歸可以進(jìn)行協(xié)變量的校正,而該方法不可以
為了克服上述兩個(gè)問(wèn)題,增加MDR方法的適用性,科學(xué)家們?cè)贛DR核心思想的基礎(chǔ)上進(jìn)行了擴(kuò)展,引入了score statistic的概念,提出了GMDR的方法,原理示意如下
MDR算法的核心是統(tǒng)計(jì)不同因子組合對(duì)應(yīng)的頻數(shù),對(duì)應(yīng)第三步中的單元格內(nèi)的頻數(shù),然后用該頻數(shù)的比值進(jìn)行降維,并進(jìn)行分類準(zhǔn)確性和預(yù)測(cè)錯(cuò)誤率的分析,從而挑選佳的模型。
GMDR仍然沿用了相同的算法框架,只不過(guò)將頻數(shù)改為了打分,關(guān)于其打分系統(tǒng)的詳細(xì)介紹參見(jiàn)下面這篇文章
https://www.cell.com/action/showPdf?pii=S0002-9297(07)61030-161030-1)
然后根據(jù)該打分值來(lái)進(jìn)行后續(xù)的降維,分類準(zhǔn)確性,預(yù)測(cè)錯(cuò)誤率等分析。在文章中也比較了MDR和GMDR的分析結(jié)果,結(jié)果如下
可以看到,MDR和GMDR結(jié)果的一致性非常高,而同樣的因子組合,GMDR的預(yù)測(cè)準(zhǔn)確率和交叉驗(yàn)證的一致率都比MDR方法好。GMDR支持廣義線性回歸等多種模型,圖示如下
可以用于處理各種類型的數(shù)據(jù),軟件下載的網(wǎng)址如下
http://www.ssg.uab.edu/gmdr/
和MDR軟件的用法完全一致,導(dǎo)入文件即可。至少要求輸入SNP位點(diǎn)的分型結(jié)果文件,內(nèi)容如下
如果需要進(jìn)行協(xié)變量的校正,也可以輸入對(duì)應(yīng)的文件,內(nèi)容如下
每一行對(duì)應(yīng)的都是一個(gè)樣本,分型結(jié)果和協(xié)變量?jī)蓚€(gè)文件中每一行對(duì)應(yīng)同一個(gè)樣本,最后一列為因變量y。導(dǎo)入文件后,點(diǎn)擊Run Analysis即可開(kāi)始分析,分析結(jié)果如下所示
和MDR輸出結(jié)果類似,也是有兩個(gè)部分,第一部分顯示了不同數(shù)量的因子相互作用中最顯著的結(jié)果, Training Bal.Acc表示訓(xùn)練集中的準(zhǔn)確率,Testing Bal.Acc表示測(cè)試集中的準(zhǔn)確率,數(shù)字越大,范圍為0-1,數(shù)值越大,準(zhǔn)確率越高,CV Consistency表示交叉驗(yàn)證的一致率,8/10表示10次交叉驗(yàn)證中8次該結(jié)果都顯著。Sign Test(p)表示p值;第二部分則顯示了對(duì)應(yīng)的score值等詳細(xì)信息。
該軟件也可以通過(guò)命令行運(yùn)行,更多用法請(qǐng)參考官方文檔。
·end·
—如果喜歡,快分享給你的朋友們吧—
往期精彩
自己動(dòng)手進(jìn)行邏輯回歸,你也可以!
GWAS大家都知道,Gene-Based GWAS你了解嗎?
3步搞定GWAS中的Gene Set Analysis
你聽(tīng)說(shuō)過(guò)Epistasis嗎?
GWAS中的Gene-Gene Interactions如何分析?看這里
終于搞清楚了Lasso回歸和Ridge回歸的區(qū)別
odd ratio置信區(qū)間的計(jì)算,你學(xué)會(huì)了嗎?
多元回歸分析存在多重共線性了怎么辦?
基因型與表型的交互作用如何分析,多元回歸來(lái)搞定
曼哈頓圖就夠了嗎?你還需要LocusZoom
GWAS做完了,下一步做什么?
? GWAS meta分析
GWAS樣本量不夠怎么辦,meta分析了解一下
你沒(méi)看錯(cuò),搞定GWAS meta分析只需一行代碼!
meta分析的森林圖不會(huì)畫(huà)?看這里
GWAMA:GWAS meta-analysis的又一利器
點(diǎn)擊鼠標(biāo)即可完成GWAS meta分析,任何人都可以!
用R進(jìn)行g(shù)was meta分析,原來(lái)如此簡(jiǎn)單
??基因型填充
GWAS中的genotype imputation簡(jiǎn)介
基因型填充中的phasing究竟是什么
基因型填充前的質(zhì)控條件簡(jiǎn)介
使用shapeit進(jìn)行單倍型分析
gtool:操作genotype data的利器
使用IMPUTE2進(jìn)行基因型填充
使用Beagle進(jìn)行基因型填充
使用Minimac進(jìn)行基因型填充
使用Eagle2進(jìn)行單倍型分析
X染色體的基因型填充
文獻(xiàn)解讀|不同基因型填充軟件性能的比較
Haplotype Reference Consortium:最大規(guī)模的單倍型數(shù)據(jù)庫(kù)
Michigan Imputation Server:基因型填充的在線工具
??CNV分析
aCGH芯片簡(jiǎn)介
aCGH芯片分析簡(jiǎn)介
基于SNP芯片進(jìn)行CNV分析中的基本知識(shí)點(diǎn)
PennCNV:利用SNP芯片檢測(cè)CNV
DGV:人類基因組結(jié)構(gòu)變異數(shù)據(jù)庫(kù)
dbvar:染色體結(jié)構(gòu)變異數(shù)據(jù)庫(kù)
DGVa:染色體結(jié)構(gòu)變異數(shù)據(jù)庫(kù)
CNVD:疾病相關(guān)的CNV數(shù)據(jù)庫(kù)
DECIPHER:疾病相關(guān)的CNV數(shù)據(jù)庫(kù)
全基因組數(shù)據(jù)CNV分析簡(jiǎn)介
使用CNVnator進(jìn)行CNV檢測(cè)
使用lumpy進(jìn)行CNV檢測(cè)
CNVnator原理簡(jiǎn)介
WES的CNV分析簡(jiǎn)介
XHMM分析原理簡(jiǎn)介
使用conifer進(jìn)行WES的CNV分析
使用EXCAVATOR2檢測(cè)WES的CNV
靶向測(cè)序的CNV分析簡(jiǎn)介
使用CNVkit進(jìn)行CNV分析
DECoN:最高分辨率的CNV檢測(cè)工具
? TCGA
TCGA數(shù)據(jù)庫(kù)簡(jiǎn)介
使用GDC在線查看TCGA數(shù)據(jù)
使用gdc-client批量下載TCGA數(shù)據(jù)
一文搞懂TCGA中的分析結(jié)果如何來(lái)
通過(guò)GDC Legacy Archive下載TCGA原始數(shù)據(jù)
使用GDC API查看和下載TCGA的數(shù)據(jù)
使用GDC下載TCGA腫瘤患者的臨床信息
使用TCGAbiolinks下載TCGA的數(shù)據(jù)
使用TCGAbiolinks進(jìn)行生存分析
使用TCGAbiolinks分析TCGA中的表達(dá)譜數(shù)據(jù)
使用TCGAbiolinks進(jìn)行甲基化和轉(zhuǎn)錄組數(shù)據(jù)的聯(lián)合分析
Broad GDAC:TCGA數(shù)據(jù)分析中心
使用cBioPortal查看TCGA腫瘤數(shù)據(jù)
UCSC ?Xena:癌癥基因組學(xué)數(shù)據(jù)分析平臺(tái)
GEPIA:TCGA和GTEx表達(dá)譜數(shù)據(jù)分析平臺(tái)
TANRIC:腫瘤相關(guān)lncRNA數(shù)據(jù)庫(kù)
SurvNet:基于網(wǎng)絡(luò)的腫瘤biomarker基因查找算法
TCPA:腫瘤RPPA蛋白芯片數(shù)據(jù)中心
TCGA Copy Number Portal:腫瘤拷貝數(shù)變異數(shù)據(jù)中心
? 生存分析
生存分析詳細(xì)解讀
用R語(yǔ)言進(jìn)行KM生存分析
使用OncoLnc進(jìn)行TCGA生存分析
用R語(yǔ)言進(jìn)行Cox回歸生存分析
使用kmplot在線進(jìn)行生存分析
? 腫瘤數(shù)據(jù)庫(kù)
ICGC:國(guó)際腫瘤基因組協(xié)會(huì)簡(jiǎn)介
HPA:人類蛋白圖譜數(shù)據(jù)庫(kù)
Oncomine:腫瘤芯片數(shù)據(jù)庫(kù)
ONGene:基于文獻(xiàn)檢索的腫瘤基因數(shù)據(jù)庫(kù)
oncomirdb:腫瘤相關(guān)的miRNA數(shù)據(jù)庫(kù)
TSGene:腫瘤抑癌基因數(shù)據(jù)庫(kù)
NCG:腫瘤驅(qū)動(dòng)基因數(shù)據(jù)庫(kù)
mutagene:腫瘤突變頻譜數(shù)據(jù)庫(kù)
CCLE:腫瘤細(xì)胞系百科全書(shū)
mSignatureDB:腫瘤突變特征數(shù)據(jù)庫(kù)
GTEx:基因型和基因表達(dá)量關(guān)聯(lián)數(shù)據(jù)庫(kù)
? 腫瘤免疫和新抗原
Cancer-Immunity Cycle:腫瘤免疫循環(huán)簡(jiǎn)介
TMB:腫瘤突變負(fù)荷簡(jiǎn)介
腫瘤微環(huán)境:Tumor microenvironment (TME)簡(jiǎn)介
腫瘤浸潤(rùn)免疫細(xì)胞量化分析簡(jiǎn)介
使用EPIC預(yù)測(cè)腫瘤微環(huán)境中免疫細(xì)胞構(gòu)成
TIMER:腫瘤浸潤(rùn)免疫細(xì)胞分析的綜合網(wǎng)站
quanTIseq:腫瘤浸潤(rùn)免疫細(xì)胞定量分析
The Cancer Immunome Atlas:腫瘤免疫圖譜數(shù)據(jù)庫(kù)
腫瘤新抗原簡(jiǎn)介
TSNAdb:腫瘤新抗原數(shù)據(jù)庫(kù)
使用NetMHCpan進(jìn)行腫瘤新抗原預(yù)測(cè)分析
? Hi-C數(shù)據(jù)分析
chromosome-territories:染色質(zhì)疆域簡(jiǎn)介
chromosome conformation capture:染色質(zhì)構(gòu)象捕獲技術(shù)
3C的衍生技術(shù)簡(jiǎn)介
解密Hi-C數(shù)據(jù)分析中的分辨率
A/B compartment:染色質(zhì)區(qū)室簡(jiǎn)介
TAD:拓?fù)潢P(guān)聯(lián)結(jié)構(gòu)域簡(jiǎn)介
chromatin loops:染色質(zhì)環(huán)簡(jiǎn)介
Promoter Capture Hi-C:研究啟動(dòng)子區(qū)染色質(zhì)互作的利器
使用HiCUP進(jìn)行Hi-C數(shù)據(jù)預(yù)處理
Juicer:Hi-C數(shù)據(jù)處理分析的利器
Juicer軟件的安裝詳解
Juicebox:Hi-C數(shù)據(jù)可視化利器
Juicer實(shí)戰(zhàn)詳解
HiC-Pro:靈活的Hi-C數(shù)據(jù)處理軟件
HiC-Pro實(shí)戰(zhàn)詳解
3D Genome Browser:Hi-C數(shù)據(jù)可視化工具
HiCPlotter:Hi-C數(shù)據(jù)可視化工具
3CDB:基于3C技術(shù)的染色質(zhì)互作信息數(shù)據(jù)庫(kù)
3DIV:染色質(zhì)空間互作數(shù)據(jù)庫(kù)
4DGenome:染色質(zhì)相互作用數(shù)據(jù)庫(kù)
4D nucleome project:染色質(zhì)三維結(jié)構(gòu)研究必不可少的參考項(xiàng)目
3dsnp:SNP在染色質(zhì)環(huán)介導(dǎo)的調(diào)控網(wǎng)絡(luò)中的分布數(shù)據(jù)庫(kù)
iRegNet3D:疾病相關(guān)SNP位點(diǎn)在三維調(diào)控網(wǎng)絡(luò)中的作用
使用WashU Epigenome Browser可視化hi-c數(shù)據(jù)
HiGlass:高度定制的Hi-C數(shù)據(jù)可視化應(yīng)用
Hi-C Data Browser:Hi-C數(shù)據(jù)瀏覽器
使用FitHiC評(píng)估染色質(zhì)交互作用的顯著性
使用TADbit識(shí)別拓?fù)潢P(guān)聯(lián)結(jié)構(gòu)域
使用pyGenomeTracks可視化hi-c數(shù)據(jù)
hi-c輔助基因組組裝簡(jiǎn)介
文獻(xiàn)解讀|使用hi-C數(shù)據(jù)輔助埃及伊蚊基因組的組裝
? chip_seq數(shù)據(jù)分析
Chip-seq簡(jiǎn)介
chip_seq質(zhì)量評(píng)估之計(jì)算樣本間的相關(guān)性
chip_seq質(zhì)量評(píng)估之查看抗體富集效果
chip_seq質(zhì)量評(píng)估之PCA分析
chip_seq質(zhì)量評(píng)估之coverage分析
chip_seq質(zhì)量評(píng)估之FRiP Score
chip_seq質(zhì)量評(píng)估之cross correlation
chip_seq質(zhì)量評(píng)估之文庫(kù)復(fù)雜度
depth, bedgraph, bigwig之間的聯(lián)系與區(qū)別
bigwig歸一化方式詳解
使用igvtools可視化測(cè)序深度分布
使用UCSC基因組瀏覽器可視化測(cè)序深度分布數(shù)據(jù)
使用deeptools查看reads分布特征
使用phantompeakqualtools進(jìn)行cross correlation分析
blacklist regions:NGS測(cè)序數(shù)據(jù)中的黑名單
MACS:使用最廣泛的peak calling軟件之一
MACS2 peak calling實(shí)戰(zhàn)
使用SICER進(jìn)行peak calling
使用HOMER進(jìn)行peak calling
peak注釋信息揭秘
PAVIS:對(duì)peak區(qū)域進(jìn)行基因注釋的在線工具
使用UPORA對(duì)peak進(jìn)行注釋
使用GREAT對(duì)peak進(jìn)行功能注釋
annoPeakR:一個(gè)peak注釋的在線工具
使用ChIPpeakAnno進(jìn)行peak注釋
使用ChIPseeker進(jìn)行peak注釋
使用PeakAnalyzer進(jìn)行peak注釋
使用homer進(jìn)行peak注釋
利用bedtools預(yù)測(cè)chip_seq數(shù)據(jù)的靶基因
? motif
關(guān)于motif你需要知道的事
詳解motif的PFM矩陣
詳解motif的PWM矩陣
使用WebLogo可視化motif
使用seqLogo可視化motif
使用ggseqlogo可視化motif
MEME:motif分析的綜合性工具
使用MEME挖掘序列中的de novo motif
使用DREME挖掘序列中的de novo motif
使用MEME-ChIP挖掘序列中的de novo motif
? chip_seq數(shù)據(jù)庫(kù)
ENCODE project項(xiàng)目簡(jiǎn)介
FactorBook:人和小鼠轉(zhuǎn)錄因子chip_seq數(shù)據(jù)庫(kù)
ReMap:人類Chip-seq數(shù)據(jù)大全
IHEC:國(guó)際人類表觀基因組學(xué)聯(lián)盟
Epifactors:表觀因子數(shù)據(jù)庫(kù)
GTRD:最全面的人和小鼠轉(zhuǎn)錄因子chip_seq數(shù)據(jù)庫(kù)
ChIP-Atlas:基于公共chip_seq數(shù)據(jù)進(jìn)行分析挖掘
Cistrome DB:人和小鼠的chip_seq數(shù)據(jù)庫(kù)
chipBase:轉(zhuǎn)錄因子調(diào)控網(wǎng)絡(luò)數(shù)據(jù)
unibind:human轉(zhuǎn)錄因子結(jié)合位點(diǎn)數(shù)據(jù)庫(kù)
chip_seq在增強(qiáng)子研究中的應(yīng)用
DENdb:human增強(qiáng)子數(shù)據(jù)庫(kù)
VISTA:人和小鼠的增強(qiáng)子數(shù)據(jù)庫(kù)
EnhancerAtlas:人和小鼠的增強(qiáng)子數(shù)據(jù)庫(kù)
FANTOM5:人類增強(qiáng)子數(shù)據(jù)庫(kù)
TiED:人類組織特異性增強(qiáng)子數(shù)據(jù)庫(kù)
HEDD:增強(qiáng)子疾病相關(guān)數(shù)據(jù)庫(kù)
HACER:human增強(qiáng)子數(shù)據(jù)庫(kù)
SEdb:超級(jí)增強(qiáng)子數(shù)據(jù)庫(kù)簡(jiǎn)介
dbSUPER:人和小鼠中的超級(jí)增強(qiáng)子數(shù)據(jù)庫(kù)
dbCoRC:核心轉(zhuǎn)錄因子數(shù)據(jù)庫(kù)
使用ROSE鑒定超級(jí)增強(qiáng)子
??18年文章目錄
2018年推文合集
掃描下方二維碼,關(guān)注我們,解鎖更多精彩內(nèi)容!
生物信息入門(mén)
只差這一個(gè)
公眾號(hào)
總結(jié)
以上是生活随笔為你收集整理的MDR的进阶版本-GMDR的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Java——》汉字转拼音
- 下一篇: 服务器的svnserver修改密码