二元逻辑回归
參考鏈接:https://jingyan.baidu.com/article/597a064395087c312b524313.html
在回歸分析模型 Y=β0+β1X+ε(一元線性回歸模型)中,Y是被解釋變量,就稱為因變量。X是解釋變量,稱為自變量
。表示為:因變量Y隨自變量X的變化而變化。協(xié)變量是指那些人為很難控制的變量,通常在回歸分析中要排除這些因素對(duì)結(jié)果的影響。
“選擇變量”即是條件變量,并且有個(gè)條件定義按鈕(rule),通過這個(gè)按鈕可以給定一個(gè)條件,只有變量值滿足這個(gè)條件的樣本數(shù)據(jù)才參與回歸分析。
logistic回歸方法的選擇:輸入、向前、向后與條件、LR、Wald
http://www.datasoldier.net/archives/2023
當(dāng)自變量較少,且研究者希望考察所有自變量與因變量間關(guān)系時(shí),可考慮使用Enter法,強(qiáng)迫所有自變量參與建模,而不考慮是否有顯著影響。
當(dāng)自變量較多,研究者希望軟件幫助篩選對(duì)因變量有顯著影響的自變量參與建模,此時(shí),新手用戶可選擇【向前:LR】或【向前:條件】方式進(jìn)行l(wèi)ogistic逐步回歸建模。
模型摘要:一般用-2對(duì)數(shù)似然 體現(xiàn)模型的擬合度,一般這個(gè)-2對(duì)數(shù)似然越小說明模型擬合度越好
Hosmer and Lemeshow Test這是一個(gè)方程擬合度檢驗(yàn),做的是虛無假設(shè),假設(shè)擬合無偏差,查看sig值,如果是>0.05,說明應(yīng)該接受結(jié)果,即認(rèn)同擬合方程與真實(shí)的方程基本沒有偏差。
也就是說這個(gè)sig值越大越好。
方程式中的變量顯著性<0.05,說明這個(gè)變量進(jìn)入模型是有意義的。
如何判斷Logistic回歸中哪個(gè)自變量更重要?
轉(zhuǎn)載自:http://www.datasoldier.net/archives/tag/logistic%e5%9b%9e%e5%bd%92
在線性回歸中,SPSS軟件直接給出了各自變量的回歸系數(shù)以及對(duì)應(yīng)的標(biāo)準(zhǔn)化回歸系數(shù),可根據(jù)后者比較各自變量對(duì)因變量的重要性,十分方便。
但是我們發(fā)現(xiàn)在logistic回歸中,SPSS軟件只給出了回歸系數(shù)而沒有提供標(biāo)準(zhǔn)化后的回歸系數(shù),那么此時(shí)應(yīng)該如何判斷自變量的重要性呢?
logistic回歸中有一個(gè)非常重要的概念,叫做OR,通俗理解為解釋變量的危險(xiǎn)程度。我在比較各自變量(解釋變量)重要性時(shí),首選使用OR值的大小對(duì)自變量進(jìn)行排序,
OR值越大說明對(duì)應(yīng)的自變量越是重要。
比如上面的例子。Exp(B)即OR值,用Exp(B)對(duì)3個(gè)自變量進(jìn)行排序,很顯然它們對(duì)目標(biāo)變量的影響重要性依次為“動(dòng)物脂肪攝入”> "高血脂史" > "A型性格" 。
這個(gè)辦法簡(jiǎn)單有效,我認(rèn)為最好是加個(gè)前提,logistic回歸模型對(duì)數(shù)據(jù)變異的擬合足夠優(yōu)秀,模型能通過統(tǒng)計(jì)檢驗(yàn),樣本量的數(shù)量足夠多能支持這個(gè)結(jié)論的穩(wěn)定性。
此外,也可以考慮使用自變量wald檢驗(yàn)(瓦爾德)的顯著性p值來對(duì)自變量重要性進(jìn)行排序,經(jīng)驗(yàn)上它的結(jié)果和OR排序是一致的。
如何計(jì)算logistic 回歸的標(biāo)準(zhǔn)化回歸系數(shù)?
先用SPSS--分析--描述性統(tǒng)計(jì)---描述 得到各變量的標(biāo)準(zhǔn)(偏)差,然后用EXCEL計(jì)算,得到各變量的標(biāo)準(zhǔn)化回歸系數(shù)
總結(jié)
- 上一篇: linux var目录满了,Linux入
- 下一篇: 魔力鸟辅助在哪下载