R语言与虚拟变量模型
學(xué)習(xí)筆記
參考書籍:《計(jì)量經(jīng)濟(jì)學(xué)》-李子奈;《統(tǒng)計(jì)學(xué):從數(shù)據(jù)到結(jié)論》-吳喜之;
虛擬變量模型
許多變量是可以定量度量的,如需求量、價(jià)格等,但也有一些因素?zé)o法定量度量,如職業(yè)、性別。為了能夠在模型中反映這些因素的影響,并提高模型的精度,需要將它們’量化’,這種’量化’通常是通過(guò)引入虛擬變量來(lái)完成的。根據(jù)這些因素的屬性類型,構(gòu)造取’0’或’1’的人工變量。通常稱為虛擬變量,記為D。
例如:反映性別的虛擬變量可取為:
D={1,man0,womanD=\begin{cases}1, man \\0, woman\end{cases} D={1,man0,woman?
一般地,在虛擬變量的設(shè)置中,基礎(chǔ)類型和肯定類型取值為1; 比較類型和否定類型取值為0。同時(shí)含有一般解釋變量與虛擬變量的模型稱為虛擬變量模型。
- 加法模型
若我們以員工薪金YYY作為因變量,工齡XXX作為一般解釋變量,性別DDD作為虛擬變量構(gòu)造虛擬變量模型,則在模型中可以將虛擬變量DDD以相加的形式引入模型,則該加法模型為:
Yi=β0+β1Xi+β2D+μiY_i=\beta_0+\beta_1 X_i + \beta_2D +\mu_i Yi?=β0?+β1?Xi?+β2?D+μi?
- 乘法模型
若在模型中將虛擬變量DDD以相乘的形式引入模型,則該乘法模型為:
Yi=β0+β1Xi+β2DXi+μiY_i=\beta_0+\beta_1 X_i + \beta_2D X_i +\mu_i Yi?=β0?+β1?Xi?+β2?DXi?+μi?
- 混合模型(自己起的名字)
我們也可以將虛擬變量DDD同時(shí)以相加和相乘的形式引入模型:
Yi=β0+β1Xi+β2D+β3DXi+μiY_i=\beta_0 + \beta_1 X_i + \beta_2 D + \beta_3 D X_i +\mu_i Yi?=β0?+β1?Xi?+β2?D+β3?DXi?+μi?
R語(yǔ)言實(shí)現(xiàn)
在個(gè)例子中,我們模擬一系列數(shù)據(jù),再用虛擬變量模型去擬合。
模擬數(shù)據(jù):
set.seed(1234) x <- c(-19:20) y1 <- 2*x + rnorm(40, 0, 2) y2 <- -x +rnorm(40, 3, 2)df1 <- data.frame(x = x, y = y1, c = rep('A', 40)) df2 <- data.frame(x = x, y = y2, c = rep('B', 40)) df <- rbind(df1, df2)plot(df$x, df$y, col = df$c, main = "散點(diǎn)圖", xlab = 'x', ylab = 'y')圖像:
回歸:
lm01 <- lm(y ~ x*c, data = df) summary(lm01)控制臺(tái)輸出:
Call: lm(formula = y ~ x * c, data = df)Residuals:Min 1Q Median 3Q Max -4.3410 -1.2588 -0.3353 0.8964 5.6449 Coefficients:Estimate Std. Error t value Pr(>|t|) (Intercept) -0.81327 0.31223 -2.605 0.0111 * x 1.97107 0.02702 72.941 < 2e-16 *** cB 3.63159 0.44156 8.225 4.09e-12 *** x:cB -2.92208 0.03822 -76.462 < 2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Residual standard error: 1.973 on 76 degrees of freedom Multiple R-squared: 0.9886, Adjusted R-squared: 0.9881 F-statistic: 2194 on 3 and 76 DF, p-value: < 2.2e-16此時(shí),各個(gè)回歸系數(shù)均通過(guò)顯著性檢驗(yàn),則被估計(jì)的虛擬變量模型為:
Yi^=?0.81+1.97Xi+3.63D?2.92DXi\hat{Y_i}=-0.81 + 1.97 X_i + 3.63 D -2.92 D X_i Yi?^?=?0.81+1.97Xi?+3.63D?2.92DXi?
注意!此時(shí)的虛擬變量DDD取為:
D={1,B0,AD=\begin{cases}1, B \\0, A\end{cases} D={1,B0,A?
總結(jié)
以上是生活随笔為你收集整理的R语言与虚拟变量模型的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 散步的正确走路方法 散步走路的正确姿势方
- 下一篇: R语言与正态总体均值的区间估计