生活随笔
收集整理的這篇文章主要介紹了
第12章 多元线性回归-整理6
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
12.1 根據(jù)下面的數(shù)據(jù)用excel進(jìn)行回歸,并對(duì)回歸結(jié)果進(jìn)行討論,計(jì)算x1=200,x2=7x_1=200,x_2=7x1?=200,x2?=7時(shí)y的預(yù)測(cè)值。
yx1x_1x1?x2x_2x2?
| 12 | 174 | 3 |
| 18 | 281 | 9 |
| 31 | 189 | 4 |
| 28 | 202 | 8 |
| 52 | 149 | 9 |
| 47 | 188 | 12 |
| 38 | 215 | 5 |
| 22 | 150 | 11 |
| 36 | 167 | 8 |
| 17 | 135 | 5 |
解:
| 回歸統(tǒng)計(jì) | |
| Multiple R | 0.459234179 |
| R Square | 0.210896032 |
| Adjusted R Square | -0.014562245 |
| 標(biāo)準(zhǔn)誤差 | 13.34121571 |
| 觀測(cè)值 | 10 |
方差分析
| df | SS | MS | F | Significance F |
| 回歸分析 | 2 | 332.9837443 | 166.4918721 | 0.935410466 | 0.436485475 |
| 殘差 | 7 | 1245.916256 | 177.9880365 | | |
| 總計(jì) | 9 | 1578.9 | | | |
| Coefficients | 標(biāo)準(zhǔn)誤差 | t Stat | P-value | Lower 95% | Upper 95% | 下限 95.0% | 上限 95.0% |
| Intercept | 25.02870068 | 22.27862726 | 1.123439985 | 0.298297649 | -27.65188163 | 77.70928299 | -27.65188163 | 77.70928299 |
| x1? | -0.049714341 | 0.105992426 | -0.469036735 | 0.653300625 | -0.300346602 | 0.200917919 | -0.300346602 | 0.200917919 |
| x2? | 1.928169254 | 1.472160474 | 1.309754805 | 0.231623881 | -1.552937105 | 5.409275613 | -1.552937105 | 5.409275613 |
回歸方程:
y^=25.02870068?0.049714341x1+1.928169254x2\hat{y}=25.02870068-0.049714341x_1+1.928169254x_2y^?=25.02870068?0.049714341x1?+1.928169254x2?
β^1=?0.049714341\hat{\beta}_1=-0.049714341β^?1?=?0.049714341表示在x2x_2x2?不變的條件下,x1x_1x1?每變化1個(gè)單位,y平均下降0.049714341個(gè)單位;β^2=1.928169254\hat{\beta}_2=1.928169254β^?2?=1.928169254表示在x1x_1x1?不變的條件下,x2x_2x2?每變化1個(gè)單位,y平均增加1.928169254個(gè)單位。
當(dāng)x1x_1x1?=200,x2=7x_2=7x2?=7時(shí),y的預(yù)測(cè)值為:y^=25.02870068?0.049714341×200+1.928169254×7=28.58\hat{y}=25.02870068-0.049714341\times200+1.928169254\times7=28.58y^?=25.02870068?0.049714341×200+1.928169254×7=28.58
12.2 一家電器銷售公司的管理人員認(rèn)為,月銷售收入是廣告費(fèi)用的函數(shù),并想通過廣告費(fèi)用對(duì)月銷售收入作出估計(jì)。下面是近8個(gè)月的月銷售收入與廣告費(fèi)用數(shù)據(jù):
月銷售收入y(萬元)電視廣告費(fèi)用x1x_1x1?(萬元)報(bào)紙廣告費(fèi)用x2x_2x2?(萬元)
| 96 | 5.0 | 1.5 |
| 90 | 2.0 | 2.0 |
| 95 | 4.0 | 1.5 |
| 92 | 2.5 | 2.5 |
| 95 | 3.0 | 3.3 |
| 94 | 3.5 | 2.3 |
| 94 | 2.5 | 4.2 |
| 94 | 3.0 | 2.5 |
要求:
(1)用電視廣告費(fèi)用作自變量,月銷售收入作因變量,建立估計(jì)的回歸方程
(2)用電視廣告費(fèi)用和報(bào)紙廣告費(fèi)用作自變量,月銷售收入作因變量,建立估計(jì)的回歸方程。
(3)上述(1)和(2)所建立的估計(jì)的回歸方程中,電視廣告費(fèi)用的系數(shù)是否相同?對(duì)其回歸系數(shù)分別進(jìn)行解釋。
(4)在根據(jù)問題(2)所建立的估計(jì)的回歸方程中,月銷售收入的總變差中被估計(jì)的回歸方程所解釋的比例是多少?
(5)針對(duì)根據(jù)問題(2)所建立的估計(jì)的回歸方程,檢驗(yàn)回歸系數(shù)是否顯著〈α=0.05)。
解:
1)y^=88.63768+1.60386x1\hat{y}=88.63768+1.60386x_1y^?=88.63768+1.60386x1?
2)
| 回歸統(tǒng)計(jì) | |
| Multiple R | 0.958663444 |
| R Square | 0.9190356 |
| Adjusted R Square | 0.88664984 |
| 標(biāo)準(zhǔn)誤差 | 0.642587303 |
| 觀測(cè)值 | 8 |
方差分析
| df | SS | MS | F | Significance F |
| 回歸分析 | 2 | 23.43540779 | 11.7177039 | 28.37776839 | 0.001865242 |
| 殘差 | 5 | 2.064592208 | 0.412918442 | | |
| 總計(jì) | 7 | 25.5 | | | |
| Coefficients | 標(biāo)準(zhǔn)誤差 | t Stat | P-value | Lower 95% | Upper 95% | 下限 95.0% | 上限 95.0% |
| Intercept | 83.23009 | 1.573868952 | 52.88247894 | 4.57175E-08 | 79.18433275 | 87.27585063 | 79.18433275 | 87.27585063 |
| 電視廣告費(fèi)用x_1x1?(萬元) | 2.29018 | 0.304064556 | 7.531899313 | 0.000653232 | 1.508560796 | 3.071806446 | 1.508560796 | 3.071806446 |
| 報(bào)紙廣告費(fèi)用x_2x2?(萬元) | 1.30099 | 0.320701597 | 4.056696662 | 0.009760798 | 0.476599398 | 2.125378798 | 0.476599398 | 2.125378798 |
y^=83.23009+2.29018x1+1.30099x2\hat{y}=83.23009+2.29018x_1+1.30099x_2y^?=83.23009+2.29018x1?+1.30099x2?
3)不相同,在1)中,β^1=1.60386\hat{\beta}_1=1.60386β^?1?=1.60386表示電視廣告費(fèi)用每增加1萬元,月銷售收入平均增加1.60386萬元;在2)中表示,在報(bào)紙廣告費(fèi)用不變的情況下,電視廣告費(fèi)用每增加1萬元,月銷售收入平均增加2.29018萬元。
4)R2=91.90%,Ra2=88.66%R^2=91.90\%,R_a^2=88.66\%R2=91.90%,Ra2?=88.66%,月銷售收入的總變差中被估計(jì)的回歸方程所解釋的比例是88.66%88.66\%88.66%
5)β1{\beta}_1β1?的P-value=0.000653232,β2{\beta}_2β2?的P-value=0.009760798,均小于0.05,兩個(gè)回歸系數(shù)均顯著。
12.3 某農(nóng)場(chǎng)通過試驗(yàn)取得早稻收獲量與春季降雨量和春季溫度的數(shù)據(jù)如下:
收獲量y(kg/hm2)y(kg/ hm^2)y(kg/hm2)降雨量x1(mm)x_1 (mm)x1?(mm)溫度x2(℃)x_2(℃)x2?(℃)
| 2250 | 25 | 6 |
| 3450 | 33 | 8 |
| 4 500 | 45 | 10 |
| 6 750 | 105 | 13 |
| 7 200 | 110 | 14 |
| 7500 | 115 | 16 |
| 8 250 | 120 | 17 |
要求:
(1) 確定早稻收獲量對(duì)春季降雨量和春季溫度的二元線性回歸方程。
(2) 解釋回歸系數(shù)的實(shí)際意義。
(3) 根據(jù)你的判斷,模型中是否存在多重共線性?
解:
1)y^=?0.5910+22.3865x1+327.6717x2\hat{y}=-0.5910+22.3865x_1+327.6717x_2y^?=?0.5910+22.3865x1?+327.6717x2?
2)回歸系數(shù)β^1\hat{β}_1β^?1?=22.3865表示,降雨量每增加1mm,小麥?zhǔn)斋@量平均增加22.3865(kg/hm2)22.3865(kg/ hm^2)22.3865(kg/hm2);回歸系數(shù)β^2\hat{β}_2β^?2?=327.6717表示,溫度每增加1℃,小麥?zhǔn)斋@量平均增加327.6717(kg/hm2)327.6717(kg/ hm^2)327.6717(kg/hm2)。
(3) 從降雨量和溫度與收獲量的關(guān)系看,兩個(gè)變量與收獲量之間都存在較強(qiáng)的關(guān)系,而且溫度與降雨量之間也存在較強(qiáng)的關(guān)系,因此,模型中可能存在多重共線性。
12.4 一家房地產(chǎn)評(píng)估公司想對(duì)某城市的房地產(chǎn)銷售價(jià)格(y)與地產(chǎn)估價(jià)(x1x_1x1?)、房產(chǎn)估價(jià)(x2x_2x2?)和使用面積(x3x_3x3?)建立一個(gè)模型,以便對(duì)銷售價(jià)格作出合理預(yù)測(cè)。為此,它收集了20棟住宅的房地產(chǎn)評(píng)估數(shù)據(jù)。
房地產(chǎn)編號(hào)銷售價(jià)格y(元/平方米)地產(chǎn)估價(jià)x1x_1x1?(萬元)房產(chǎn)估價(jià)x2x_2x2?(萬元)使用面積x3x_3x3?(平方米)
| 1 | 6890 | 596 | 4497 | 18730 |
| 2 | 4850 | 900 | 2780 | 9 280 |
| 3 | 5550 | 950 | 3144 | 11 260 |
| 4 | 6 200 | 1000 | 3959 | 12650 |
| 5 | 11 650 | 1 800 | 7283 | 22140 |
| 6 | 4 500 | 850 | 2732 | 9120 |
| 7 | 3 800 | 800 | 2986 | 8 990 |
| 8 | 8300 | 2300 | 4775 | 18030 |
| 9 | 5 900 | 810 | 3912 | 12040 |
| 10 | 4 750 | 900 | 2935 | 17250 |
| 11 | 4 050 | 730 | 4012 | 10 800 |
| 12 | 4 000 | 800 | 3168 | 15 290 |
| 13 | 9 700 | 2000 | 5851 | 24 550 |
| 14 | 4 550 | 800 | 2345 | 11 510 |
| 15 | 4 090 | 800 | 2089 | 11 730 |
| 16 | 8 000 | 1050 | 5625 | 19 600 |
| 17 | 5 600 | 400 | 2086 | 13440 |
| 18 | 3 700 | 450 | 2261 | 9 880 |
| 19 | 5 000 | 340 | 3595 | 10 760 |
| 20 | 2240 | 150 | 578 | 9620 |
用Excel進(jìn)行回歸,并回答下面的問題:
(1)寫出估計(jì)的多元回歸方程。
(2)銷售價(jià)格的總變差中被估計(jì)的回歸方程所解釋的比例是多少?
(3)檢驗(yàn)回歸方程的線性關(guān)系是否顯著(α=0.05)。
(4)檢驗(yàn)各回歸系數(shù)是否顯著(α=0.05)。
解:
回歸統(tǒng)計(jì)
| Multiple R | 0.947362461 |
| R Square | 0.897495632 |
| Adjusted R Square | 0.878276063 |
| 標(biāo)準(zhǔn)誤差 | 791.6823283 |
| 觀測(cè)值 | 20 |
方差分析
| df | SS | MS | F | Significance F |
| 回歸分析 | 3 | 87803505.46 | 29267835.15 | 46.69696966 | 3.87913E-08 |
| 殘差 | 16 | 10028174.54 | 626760.909 | | |
| 總計(jì) | 19 | 97831680 | | | |
| Coefficients | 標(biāo)準(zhǔn)誤差 | t Stat | P-value | Lower 95% | Upper 95% | 下限 95.0% | 上限 95.0% |
| Intercept | 148.700454 | 574.421324 | 0.25887001 | 0.799036421 | -1069.018355 | 1366.419263 | -1069.018355 | 1366.419263 |
| 地產(chǎn)估價(jià) | 0.814738183 | 0.511988507 | 1.591321236 | 0.13109905 | -0.270628965 | 1.900105332 | -0.270628965 | 1.900105332 |
| 房產(chǎn)估價(jià) | 0.820979542 | 0.211176502 | 3.887646272 | 0.001307361 | 0.373305355 | 1.268653728 | 0.373305355 | 1.268653728 |
| 使用面積 | 0.135041012 | 0.065863312 | 2.050322204 | 0.057088037 | -0.004582973 | 0.274664997 | -0.004582973 | 0.274664997 |
1)y^=148.7005+0.8147x1+0.8210x2+0.1350x3\hat{y}=148.7005+0.8147x_1+0.8210x_2+0.1350x_3y^?=148.7005+0.8147x1?+0.8210x2?+0.1350x3?
2)R2=89.75%,Ra2=87.83%R^2=89.75\%,R_a^2=87.83\%R2=89.75%,Ra2?=87.83%
3)Significance F=3.88E-08<0.05 顯著
4)β1的P?value=0.1311>α,不顯著;\beta_1的P-value=0.1311>\alpha,不顯著;β1?的P?value=0.1311>α,不顯著;
β2的P?value=0.0013<α,顯著\beta_2的P-value=0.0013<\alpha,顯著β2?的P?value=0.0013<α,顯著;
β3的P?value=0.0571>α,不顯著\beta_3的P-value=0.0571>\alpha,不顯著β3?的P?value=0.0571>α,不顯著
12.5 下面是隨機(jī)抽取的15家大型商場(chǎng)銷售的同類產(chǎn)品的有關(guān)數(shù)據(jù):
單位:元
企業(yè)編號(hào)銷售價(jià)格y購(gòu)進(jìn)價(jià)格x1x_1x1?銷售費(fèi)用x2x_2x2?
| 1 | 1238 | 966 | 223 |
| 2 | 1 266 | 894 | 257 |
| 3 | 1 200 | 440 | 387 |
| 4 | 1193 | 664 | 310 |
| 5 | 1106 | 791 | 339 |
| 6 | 1 303 | 852 | 283 |
| 7 | 1313 | 804 | 302 |
| 8 | 1144 | 905 | 214 |
| 9 | 1286 | 771 | 304 |
| 10 | 1084 | 511 | 326 |
| 11 | 1120 | 505 | 339 |
| 12 | 1 156 | 851 | 235 |
| 13 | 1 083 | 659 | 276 |
| 14 | 1 263 | 490 | 390 |
| 15 | 1246 | 696 | 316 |
要求:
(1)計(jì)算y與x1、y與x2x_1、y與x_2x1?、y與x2?之間的相關(guān)系數(shù),是否有證據(jù)表明銷售價(jià)格與購(gòu)進(jìn)價(jià)格、銷售價(jià)格與銷售費(fèi)用之間存在線性關(guān)系?
(2)根據(jù)上述結(jié)果,你認(rèn)為用購(gòu)進(jìn)價(jià)格和銷售費(fèi)用來預(yù)測(cè)銷售價(jià)格是否有效?
(3)用 Excel進(jìn)行回歸,并檢驗(yàn)?zāi)P偷木€性關(guān)系是否顯著(α=0.05)。
(4)解釋判定系數(shù)R2R^2R2,所得的結(jié)論與(2)是否一致?
(5)計(jì)算x1與x2x_1與x_2x1?與x2?之間的相關(guān)系數(shù),所得結(jié)果意味著什么?
(6)模型中是否存在多重共線性?你對(duì)模型有何建議?
解:1)ryx1=0.3090;ryx2=0.0012r_{yx_1}=0.3090;r_{yx_2}=0.0012ryx1??=0.3090;ryx2??=0.0012
t1=∣r∣n?21?r2=1.1712t_1=|r|\sqrt{\frac{n-2}{1-r^2}}=1.1712t1?=∣r∣1?r2n?2??=1.1712
t2=∣r∣n?21?r2=0.0044t_2=|r|\sqrt{\frac{n-2}{1-r^2}}=0.0044t2?=∣r∣1?r2n?2??=0.0044
tα/2(n?2)=2.1604t_{\alpha/2}(n-2)=2.1604tα/2?(n?2)=2.1604
t1<tα/2(n?2),t2<tα/2(n?2)t_1<t_{\alpha/2}(n-2),t_2<t_{\alpha/2}(n-2)t1?<tα/2?(n?2),t2?<tα/2?(n?2)
所以沒有證據(jù)表明銷售價(jià)格與購(gòu)進(jìn)價(jià)格、銷售價(jià)格與銷售費(fèi)用之間存在線性關(guān)系
2)無效
3)
| 回歸統(tǒng)計(jì) | |
| Multiple R | 0.59368371 |
| R Square | 0.352460348 |
| Adjusted R Square | 0.244537073 |
| 標(biāo)準(zhǔn)誤差 | 69.75121229 |
| 觀測(cè)值 | 15 |
| 方差分析 | | | | | |
| df | SS | MS | F | Significance F |
| 回歸分析 | 2 | 31778.15394 | 15889.07697 | 3.26584184 | 0.073722186 |
| 殘差 | 12 | 58382.77939 | 4865.231616 | | |
| 總計(jì) | 14 | 90160.93333 |
| Coefficients | 標(biāo)準(zhǔn)誤差 | t Stat | P-value | Lower 95% | Upper 95% | 下限 95.0% | 上限 95.0% |
| Intercept | 375.6018288 | 339.410562 | 1.10662976 | 0.290145025 | -363.9102582 | 1115.113916 | -363.9102582 | 1115.113916 |
| 購(gòu)進(jìn)價(jià)格x_1x1? | 0.537840951 | 0.21044674 | 2.55571054 | 0.02519961 | 0.079316894 | 0.996365008 | 0.079316894 | 0.996365008 |
| 銷售費(fèi)用x_2x2? | 1.457193542 | 0.667706586 | 2.182386056 | 0.049681066 | 0.002385867 | 2.912001217 | 0.002385867 | 2.912001217 |
Significance F=0.0737>0.05,不顯著
4)R2=35.25%,Ra2=24.45%R^2=35.25\%,R_a^2=24.45\%R2=35.25%,Ra2?=24.45%,一致
5)rx1x2=?0.8529r_{x_1x_2}=-0.8529rx1?x2??=?0.8529,x1x2x_1x_2x1?x2?之間高度負(fù)相關(guān)
6)因?yàn)?span id="ozvdkddzhkzd" class="katex--inline">x1x2x_1x_2x1?x2?之間高度負(fù)相關(guān),可能存在多重共線性。可剔除一個(gè)變量建立模型再驗(yàn)證。
總結(jié)
以上是生活随笔為你收集整理的第12章 多元线性回归-整理6的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。