数学建模-分类模型
分類模型
1. 二分類模型-SPSS實(shí)現(xiàn)
1.1數(shù)據(jù)預(yù)處理
定性變量生成定量的虛擬變量
- 步驟:SPSS->轉(zhuǎn)換->創(chuàng)建虛變量
1.2 使用邏輯回歸進(jìn)行處理
- 根據(jù)原理:兩點(diǎn)分布(伯努利分布)
在給定xxx的情況下,考慮yyy的兩點(diǎn)分布概率:
{P(y=1∣x)=F(x,β)P(y=0∣x)=1?F(x,β)\begin{cases} P(y=1|x)=F(x,β)\\ P(y=0|x)=1-F(x,β)\end{cases} {P(y=1∣x)=F(x,β)P(y=0∣x)=1?F(x,β)?
F(x,β)F(x,β)F(x,β)稱為連接函數(shù)(link function),它將解釋變量xxx和被解釋變量yyy連接起來
-
步驟:SPSS->分析->回歸->二元Logistic(保存:概率、組成員)
-
預(yù)測結(jié)果較差怎么辦?(準(zhǔn)確率較低)
- 可在logistic回歸模型中加入平方項(xiàng)、交互項(xiàng)
- 選擇變量->轉(zhuǎn)換->計(jì)算變量
- 重新進(jìn)行二元Logistic,協(xié)變量里要把原來的和處理后的變量都加入
- 但容易出現(xiàn)過擬合現(xiàn)象,變量的顯著性變得很高
- 可在logistic回歸模型中加入平方項(xiàng)、交互項(xiàng)
-
如何確定合適的模型?
- 交叉驗(yàn)證方法:
- 把已知數(shù)據(jù)分為訓(xùn)練組和測試組
- 一般設(shè)置為8:2
- 利用訓(xùn)練組的數(shù)據(jù)來估計(jì)出模型,再用測試組的數(shù)據(jù)來進(jìn)行測試
- 交叉驗(yàn)證方法:
1.3 Fisher線性判別分析
LDA(Linear Discriminant Analysis)是一種經(jīng)典的線性判別方法,又稱Fisher判別分析
給定訓(xùn)練集樣例,設(shè)法將樣例投影到一維的直線上,使得同類樣例的投影點(diǎn)盡可能接近和密集,異類投影點(diǎn)盡可能遠(yuǎn)離。
1.3.1SPSS實(shí)現(xiàn)方法
-
步驟:分析->分類->判別式->添加分組變量(y)->定義范圍(種類)->添加自變量->統(tǒng)計(jì)(費(fèi)希爾、未標(biāo)準(zhǔn)化)->分類(摘要表)->保存(預(yù)判組成員、組成員概率)
-
關(guān)注點(diǎn):未標(biāo)準(zhǔn)化系數(shù)(線性系數(shù)ω)、分類結(jié)果
2.多分類模型
- Fisher判別同樣適用,在SPSS中修改定義范圍即可
- 邏輯回歸方法:多元Logistic回歸
總結(jié)
- 上一篇: 惊了!最通俗易懂的Djongo入门竟然在
- 下一篇: Markdown简单上手