多元统计分析因子分析何晓群版课后作业
一、實驗目的
因子分析模型是主成分分析的推廣。它也是利用降維的思想,從研究原始變量相關矩陣內部的依賴關系出發,把一些具有錯綜復雜關系的變量歸結為少數幾個綜合因子的一種多變量統計分析方法。將數據整理,找出變量間的相關性,通過因子分析從而對數據進行分析。
二、實驗內容
1,區域公用事業的發展是地區綜合發展的重要組成部分,是促進社會發展的重要因素。因此,分析評價全國?31?個省、直轄市、自治區在城市公共交通、市政、設施等各方面的建設,把握各地區公用事業的整體發展水平具有重要意義。下面應用因子分析模型,選取反映城市公用事業建設的?12?個指標作為原始變量,對全國各地區公用事業的整體發展水平做分析評價這?12?個指標分別為?X1:城區面積(平方公里);X2:建成區面積(平方公里);X3:人均公園綠地面積(平方米);X4:城市建設用地面積(平方公里);X5:年末實有道路長度(公里);X6:年末實有道路面積(萬平方米);X7:城市排水管道長度(公里);X8:城市道路照明燈(千盞);X9:年末公共交通車輛運營數(輛);X10:運營線路總長度(公里);X11:每萬人擁有公共交通車輛(標臺);X12:出租汽車數量(輛)。原始數據來源于?2017?年《中國統計年鑒》。參見表1。
表1 2016年區域公共事業指標數據
| 地區 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | x10 | x11 | x12 |
| 北京 ??????????????? | 16410 | 1419.7 | 16.01 | 1463.8 | 8086 | 14316 | 16901 | 300.6 | 27892 | 20392 | 24.31 | 68484 |
| 天津 ??????????????? | 2583.3 | 1007.9 | 10.59 | 961.7 | 7888 | 14466 | 20951 | 353.1 | 13655 | 17932 | 18.09 | 31940 |
| 河北 ??????????????? | 6613.4 | 2056.5 | 14.31 | 1944.9 | 14418 | 33252 | 17954 | 753.1 | 21479 | 26077 | 13.68 | 53034 |
| 山西 ??????????????? | 2893.3 | 1157.6 | 11.86 | 1129 | 7671 | 16705 | 8169 | 543.3 | 8895 | 13813 | 9.42 | 30690 |
| 內蒙古 ????????????? | 4871.7 | 1241.6 | 19.77 | 1146.9 | 9728 | 20808 | 12971 | 756.6 | 8000 | 16495 | 10.26 | 45499 |
| 遼寧 ??????????????? | 15148.1 | 2798.2 | 11.33 | 2718.2 | 16394 | 29277 | 18275 | 1282.6 | 22950 | 26222 | 12.91 | 80743 |
| 吉林 ??????????????? | 5111.5 | 1425.8 | 13.37 | 1379.5 | 10669 | 17084 | 8445 | 527.9 | 11670 | 13267 | 10.26 | 56413 |
| 黑龍江 ????????????? | 2735.6 | 1810.2 | 11.91 | 1821.8 | 12750 | 19667 | 10722 | 646 | 16939 | 20256 | 13.58 | 64158 |
| 上海 ??????????????? | 6340.5 | 998.8 | 7.83 | 1913.3 | 5129 | 10582 | 19508 | 559.1 | 20718 | 24787 | 12.7 | 47271 |
| 江蘇 ??????????????? | 15277.6 | 4299.3 | 14.79 | 4367.4 | 44999 | 79733 | 72823 | 3510.4 | 41131 | 62726 | 16.57 | 53376 |
| 浙江 ??????????????? | 11311.8 | 2673.3 | 13.17 | 2573.4 | 21215 | 41286 | 40550 | 1526.3 | 32551 | 70040 | 16.27 | 37781 |
| 安徽 ??????????????? | 6100.4 | 2001.7 | 14.02 | 1959.7 | 14154 | 33100 | 26388 | 1015 | 14605 | 14785 | 11.95 | 39199 |
| 福建 ??????????????? | 4440.9 | 1469.2 | 13.08 | 1365.6 | 8656 | 17657 | 14329 | 723.3 | 16238 | 23563 | 15.26 | 21727 |
| 江西 ??????????????? | 2369.3 | 1371 | 14.16 | 1279.3 | 8977 | 18936 | 13326 | 686.7 | 8136 | 14311 | 8.86 | 13712 |
| 山東 ??????????????? | 22424.2 | 4795.5 | 17.91 | 4540 | 40685 | 83011 | 56796 | 1869.8 | 47419 | 82149 | 15.88 | 61314 |
| 河南 ??????????????? | 4822.8 | 2544.3 | 10.43 | 2424.6 | 13140 | 31621 | 21376 | 897.5 | 22955 | 20840 | 10.88 | 46598 |
| 湖北 ??????????????? | 8334.2 | 2248.9 | 10.99 | 2111.8 | 18622 | 33293 | 23922 | 746.9 | 20915 | 18826 | 12.76 | 36415 |
| 湖南 ??????????????? | 4373.1 | 1625.6 | 10.57 | 1511.1 | 12292 | 22477 | 13846 | 697.2 | 19363 | 17779 | 15.13 | 26173 |
| 廣東 ??????????????? | 17086.3 | 5808.1 | 17.87 | 5266.6 | 38930 | 71204 | 56323 | 2596.8 | 63670 | 102707 | 14.2 | 68504 |
| 廣西 ??????????????? | 5752 | 1333.8 | 11.77 | 1292.6 | 8585 | 18555 | 11480 | 677.3 | 9093 | 13143 | 9.77 | 17337 |
| 海南 ??????????????? | 1428.2 | 321 | 12.02 | 302.1 | 2503 | 5195 | 4192 | 173.7 | 3080 | 5866 | 11.35 | 6683 |
| 重慶 ??????????????? | 7438.5 | 1350.7 | 16.86 | 1179.6 | 8498 | 17776 | 15553 | 569.6 | 12810 | 14565 | 10.7 | 21100 |
| 四川 ??????????????? | 7872.7 | 2615.6 | 12.47 | 2468.5 | 14835 | 31352 | 26486 | 1189.1 | 23583 | 24910 | 12.9 | 33394 |
| 貴州 ??????????????? | 3104.8 | 844.6 | 14.98 | 776.9 | 4022 | 8208 | 6060 | 473.6 | 6565 | 8656 | 11.36 | 19021 |
| 云南 ??????????????? | 3127.7 | 1131.3 | 11.33 | 1027.2 | 5995 | 14768 | 13133 | 514.8 | 11166 | 20821 | 13.17 | 19130 |
| 西藏 ??????????????? | 449.8 | 145.2 | 7.84 | 186.8 | 1134 | 1986 | 1422 | 60.2 | 580 | 1035 | 6.2 | 1882 |
| 陜西 ??????????????? | 2334.8 | 1127.4 | 12.3 | 1096.3 | 6783 | 15265 | 8678 | 653.9 | 12696 | 10542 | 16.01 | 24458 |
| 甘肅 ??????????????? | 1580.1 | 870.4 | 13.94 | 806 | 4668 | 9933 | 5802 | 306.9 | 5233 | 6429 | 9.16 | 23395 |
| 青海 ??????????????? | 688.2 | 197.4 | 10.78 | 176 | 1019 | 2059 | 1744 | 122.1 | 2248 | 3039 | 14.49 | 8344 |
| 寧夏 ??????????????? | 2119.2 | 441.8 | 18.3 | 384.1 | 2214 | 6578 | 1626 | 258.3 | 3357 | 5019 | 13.47 | 12504 |
| 新疆 ??????????????? | 3034.9 | 1199.4 | 12.22 | 1187 | 7791 | 13673 | 6864 | 631.5 | 9250 | 8429 | 15.24 | 32284 |
三、實驗過程
第?1?步:讀人數據,進行?KMO?檢驗和?Bartlett?檢驗。結果顯示該例的數據非常適合做因子分析。
ex6.3<-read.table(file.choose(),head=TRUE,fileEncoding="utf8")##找到文件6.3賦值給ex6.3
dat63<-ex6.3[,-1]##不要數據的第一列賦值給dat63
rownames(dat63)<-ex6.3[,1]##提取ex6.3中的第一列
dat63<-scale(dat63,center=TRUE,scale=TRUE)##將數據標準化
library(psych)##調用這個psych這個函數
psych::KMO(r=dat63)##對dat63進行KMO檢驗
cortest.bartlett(cor(dat63))##進行Bartlett?檢驗
##得出下面這些數據
$chisq##卡方分布
[1] 2453.293
$p.value##p值
[1] 0
$df##自由度
[1] 66
第2?步:選擇因子個數。方差解釋表和碎石圖(見圖?2)顯示,前三個公共因子總的方差貢獻率為?90.8%,基本提取了樣本所包含的信息;隨著公共因子個數大于?3,碎石圖中曲線的變化趨勢明顯趨于平穩,因此確定選擇三個公共因子。
###方差解釋
fit63_var<-psych::principal(dat63,nfactors=3,rotate='varimax',covar=TRUE)##求出方差
lam63<-fit63_var$values###特征值
cumlam63<-cumsum(lam63)/sum(lam63)##求出比列
VE63<-data.frame(lam63,lam63/sum(lam63),cumlam63)##求出累計貢獻率
colnames(VE63)<-c("特征值","比例","累計比例")##行名為這些
Z<-round(VE63,3)##保留三位小數
Write.csv(z)
表 2
| 特征值 | 比例 | 累計比例 | |
| 1 | 8.98 | 0.748 | 0.748 |
| 2 | 1.049 | 0.087 | 0.836 |
| 3 | 0.866 | 0.072 | 0.908 |
| 4 | 0.551 | 0.046 | 0.954 |
| 5 | 0.215 | 0.018 | 0.972 |
| 6 | 0.155 | 0.013 | 0.985 |
| 7 | 0.075 | 0.006 | 0.991 |
| 8 | 0.056 | 0.005 | 0.996 |
| 9 | 0.032 | 0.003 | 0.998 |
| 10 | 0.011 | 0.001 | 0.999 |
| 11 | 0.006 | 0 | 1 |
| 12 | 0.004 | 0 | 1 |
##碎石圖
?
圖1 碎石圖
第?3?步:因子載荷和因子得分。為便于解釋公共因子的實際意義,旋轉載荷矩陣表中給出了進行方差最大化正交旋轉后的因子載荷。可以看出,第一個公共因子?F?1主要由?X2建成區面積、X4城市建設用地面積、X5年末實有道路長度、X6年末實有道路面積、X7城市排水管道長度、X8城市道路照明燈、X9年末公共交通車輛運營數、X10運營線路總長度決定,而且各指標對?F1的貢獻基本相當。X2,X4是反映城市基礎建設的指標,X5,X6,X7,X8是反映城市市政設施建設的指標,X9,X10是反映公共交通建設的指標。因此,F1是相對綜合的因子,基本反映了城市公共建設的整體水平。第二個公共因子?F2主要由每萬人擁有公共交通車輛決定,主要反映公共交通的建設水平,擁有的公共交通車輛越多,公民的出行越便利。第三個公共因子?F3主要由人均公園綠地面積決定,主要反映城市基礎建設的情況。
##因子載荷
load63<-as.matrix.data.frame(fit63_var$loadings)##將其轉化為矩陣
rownames(load63)<-colnames(dat63)##確定列名
x<-round(load63,3)##輸出表格
write.csv(x,"2.csv")
表3
| V1 | V2 | V3 | |
| x1 | 0.743 | 0.5 | 0.239 |
| x2 | 0.948 | 0.21 | 0.153 |
| x3 | 0.204 | 0.096 | 0.972 |
| x4 | 0.957 | 0.24 | 0.083 |
| x5 | 0.952 | 0.178 | 0.168 |
| x6 | 0.951 | 0.15 | 0.196 |
| x7 | 0.93 | 0.217 | 0.113 |
| x8 | 0.933 | 0.093 | 0.135 |
| x9 | 0.876 | 0.413 | 0.097 |
| x10 | 0.889 | 0.248 | 0.176 |
| x11 | 0.093 | 0.922 | 0.07 |
| x12 | 0.541 | 0.592 | 0.059 |
c<-round(fit63_var$scores,3)
write.csv(c,"3.csv")
表4
| RC1 | RC2 | RC3 | |
| 北京 | -1.203 | 3.851 | 0.924 |
| 天津 | -0.651 | 1.192 | -0.926 |
| 河北 | 0.057 | 0.389 | 0.301 |
| 山西 | -0.214 | -0.878 | -0.347 |
| 內蒙古 | -0.524 | -0.613 | 2.443 |
| 遼寧 | 0.556 | 0.962 | -0.856 |
| 吉林 | -0.261 | -0.178 | 0.075 |
| 黑龍江 | -0.151 | 0.586 | -0.621 |
| 上海 | -0.005 | 0.493 | -2.013 |
| 江蘇 | 2.655 | -0.033 | 0.034 |
| 浙江 | 0.959 | 0.556 | -0.189 |
| 安徽 | 0.232 | -0.406 | 0.254 |
| 福建 | -0.363 | 0.282 | 0.022 |
| 江西 | -0.117 | -1.481 | 0.515 |
| 山東 | 2.18 | 0.644 | 1.31 |
| 河南 | 0.581 | -0.407 | -1.154 |
| 湖北 | 0.429 | -0.059 | -0.827 |
| 湖南 | -0.127 | 0.346 | -0.925 |
| 廣東 | 2.744 | 0.154 | 0.984 |
| 廣西 | -0.081 | -0.997 | -0.312 |
| 海南 | -0.875 | -0.701 | -0.104 |
| 重慶 | -0.388 | -0.693 | 1.495 |
| 四川 | 0.543 | -0.205 | -0.368 |
| 貴州 | -0.756 | -0.582 | 0.854 |
| 云南 | -0.381 | -0.182 | -0.532 |
| 西藏 | -0.486 | -1.854 | -1.532 |
| 陜西 | -0.65 | 0.504 | -0.247 |
| 甘肅 | -0.601 | -1.034 | 0.467 |
| 青海 | -1.147 | 0.095 | -0.568 |
| 寧夏 | -1.32 | -0.229 | 2.121 |
| 新疆 | -0.638 | 0.477 | -0.276 |
##圖2
plot(fit63_var$scores,pch="o",xlab="第一因子",ylab="第二因子")##橫軸為第一因子,縱軸為第二因子
abline(h=1,lty=1)
abline(v=0,lty=1)
text(fit63_var$scores,ex6.3[,1],adj=-0.05)##顯示名字
為更加直觀地分析各地區公用事業建設的水平,以?F1因子得分為x軸,F2因子得分為y軸畫散點圖,如圖?2?所示。
?
圖2 因子的散點圖
四、實驗結果
由散點圖可知,除北京在因子?F2?上的得分較大外,其他地區在?F2上的得分相差不是特別大,說明北京的公共交通極其便利,在其他地區中上海的公共交通最便利,西藏的公共交通建設最差,很明顯,西藏地區的公共交通建設主要受地理因素的影響。在較為綜合的因子F1上,得分最高的是廣東,說明廣東省公用事業的綜合發展水平較高,基礎設施建設比較全面,但公共交通建設有待進一步加強。F1的得分較高的地區還有江蘇、山東、浙江、河南,其中江蘇和浙江地區的經濟發展水平也較高,說明這些地區的發展相對比較全面,人民的生活質量可以較好地得到保障。另外,F1的得分較低的地區有寧夏、青海、海南、貴州、陜西、新疆。一方面這些地區的經濟發展水平相對較低;另一方面這些地區所處的環境相對較差,可能會對公用事業建設產生較大影響。因此,全國各地區若要全面協調發展,國家應加大對西部地區的投資和幫扶力度,促進西部地區的發展。
1.研究目的:
為研究新疆各地、州、市、縣總產肉量。我們從《新疆統計年鑒2013》上收集到各地區的總產肉量數據來進行因子分析。具體數據如下:
2.多元變量的選擇與數據:
:牛(噸) ??:馬(噸) ??:駱駝(噸) ?:豬(噸)山羊(噸) :綿羊(噸) :禽肉(噸) ?:兔肉(噸)
表5
| 地區 | x1 | x2 | x3 | x4 | x5 | x6 | x7 |
| 烏魯木齊 | 18613 | 2084 | 323 | 18133 | 4409 | 13630 | 7352 |
| 克拉瑪依市 | 504 | 15 | 1700 | 9040 | 192 | 562 | 535 |
| 吐魯番市 | 3750 | 50 | 4300 | 1725 | 1454 | 12785 | 1210 |
| 哈密市 | 5491 | 73 | 66 | 5223 | 2402 | 11956 | 2244 |
| 昌吉市 | 19362 | 1068 | 22 | 42043 | 2767 | 15901 | 19372 |
| 阜康市 | 10560 | 478 | 38 | 15347 | 2363 | 10118 | 14925 |
| 伊寧市 | 4985 | 580 | 0 | 3676 | 179 | 2466 | 1690 |
| 奎屯市 | 60 | 24 | 500 | 4090 | 16 | 142 | 294 |
| 塔城市 | 5283 | 1050 | 400 | 1396 | 692 | 6131 | 1520 |
| 烏蘇市 | 8340 | 1890 | 88 | 13088 | 3215 | 9197 | 1542 |
| 阿勒泰市 | 9645 | 962 | 96 | 504 | 454 | 5126 | 442 |
| 博樂市 | 1938 | 157 | 3 | 3955 | 216 | 3002 | 1177 |
| 庫爾勒市 | 2366 | 2 | 300 | 6059 | 571 | 4461 | 6440 |
| 阿克蘇市 | 10530 | 224 | 4 | 14264 | 1858 | 8805 | 17036 |
| 阿圖什市 | 6210 | 285 | 5 | 580 | 1324 | 5396 | 2000 |
| 喀什市 | 6549 | 222 | 6 | 3600 | 111 | 14437 | 2074 |
| 和田市 | 2548 | 7899 | 7 | 1537 | 63 | 5148 | 4816 |
三、實驗過程
第?1?步:讀人數據,進行?KMO?檢驗和?Bartlett?檢驗。結果顯示該例的數據非常適合做因子分析。
ex6.32<-read.table(file.choose(),head=TRUE,fileEncoding="utf8")##找到文件6.32賦值給ex6.32
dat632<-ex6.32[,-1]##不要數據的第一列賦值給dat632
rownames(dat632)<-ex6.32[,1]##提取ex6.32中的第一列
dat632<-scale(dat632,center=TRUE,scale=TRUE)##將數據標準化
library(psych)##調用這個psych這個函數
psych::KMO(r=dat632)##對dat632進行KMO檢驗
Kaiser-Meyer-Olkin factor adequacy
Call: psych::KMO(r = dat632)
Overall MSA = ?0.76
MSA for each item =
x1 ??x2 ??x3 ??x4 ??x5 ??x6 ??x7
0.76 0.50 0.36 0.78 0.84 0.78 0.78
cortest.bartlett(cor(dat632))##進行Bartlett?檢驗
##得出下面這些數據
$chisq
[1] 390.463
$p.value
[1] 8.699204e-70
$df
[1] 21
第2?步:選擇因子個數。方差解釋表和碎石圖(見圖?3)顯示,前三個公共因子總的方差貢獻率為?82.8%,基本提取了樣本所包含的信息;隨著公共因子個數大于?3,碎石圖中曲線的變化趨勢明顯趨于平穩,因此確定選擇三個公共因子。
###方差解釋
fit632_var<-psych::principal(dat632,nfactors=3,rotate='varimax',covar=TRUE)##求出方差
lam632<-fit632_var$values###特征值
cumlam632<-cumsum(lam632)/sum(lam632)##求出比列
VE632<-data.frame(lam632,lam632/sum(lam632),cumlam632)##求出累計貢獻率
colnames(VE632)<-c("特征值","比例","累計比例")
z<-round(VE632,3)
write.csv(z,"1.csv")
表6
| 特征值 | 比例 | 累計比例 | |
| 1 | 3.663 | 0.523 | 0.523 |
| 2 | 1.245 | 0.178 | 0.701 |
| 3 | 0.890 | 0.127 | 0.828 |
| 4 | 0.574 | 0.082 | 0.910 |
| 5 | 0.324 | 0.046 | 0.957 |
| 6 | 0.174 | 0.025 | 0.982 |
| 7 | 0.129 | 0.018 | 1.000 |
plot(lam632,type="o",xlab="因子序號",ylab="特征值")
?
圖3
第?3?步:因子載荷和因子得分。為便于解釋公共因子的實際意義,旋轉載荷矩陣表中給出了進行方差最大化正交旋轉后的因子載荷。可以看出,第一個公共因子?F?1主要由?X1牛、X4豬、X5山羊、X6綿羊決定,而且各指標對?F1的貢獻基本相當。說明這些是新疆主要肉產品;第二個公共因子?F2主要由駱駝決定,主要反映該地區主要是沙漠,駱駝在這邊易生存。第三個公共因子?F3主要由馬決定,主要反映該地區易于飼養馬匹情況。
##因子載荷
load632<-as.matrix.data.frame(fit632_var$loadings)##轉化為矩陣
rownames(load632)<-colnames(dat632)##確定列名
x<-round(load632,3)
write.csv(x,"2.csv")
表7
| V1 | V2 | V3 | |
| x1 | 0.918 | -0.187 | 0.041 |
| x2 | 0.003 | -0.120 | 0.981 |
| x3 | -0.060 | 0.918 | -0.137 |
| x4 | 0.846 | -0.269 | -0.119 |
| x5 | 0.861 | 0.097 | 0.040 |
| x6 | 0.841 | 0.280 | 0.075 |
| x7 | 0.760 | -0.387 | -0.066 |
c<-round(fit632_var$scores,3)
write.csv(c,"3.csv")
表8
| RC1 | RC2 | RC3 | |
| 烏魯木齊 | 1.738 | 0.387 | 0.779 |
| 克拉瑪依市 | -0.930 | 0.496 | -0.731 |
| 吐魯番市 | 0.205 | 3.512 | -0.211 |
| 哈密市 | 0.219 | 0.338 | -0.217 |
| 昌吉市 | 2.397 | -0.853 | -0.321 |
| 阜康市 | 0.913 | -0.593 | -0.400 |
| 伊寧市 | -0.827 | -0.628 | -0.303 |
| 奎屯市 | -1.206 | -0.348 | -0.673 |
| 塔城市 | -0.529 | 0.050 | 0.104 |
| 烏蘇市 | 0.505 | 0.182 | 0.612 |
| 阿勒泰市 | -0.511 | -0.267 | 0.075 |
| 博樂市 | -0.935 | -0.539 | -0.518 |
| 庫爾勒市 | -0.547 | -0.443 | -0.661 |
| 阿克蘇市 | 0.773 | -0.863 | -0.618 |
| 阿圖什市 | -0.438 | -0.240 | -0.270 |
| 喀什市 | -0.092 | 0.176 | -0.165 |
| 和田市 | -0.735 | -0.369 | 3.519 |
plot(fit632_var$scores,pch="o",xlab="第一因子",ylab="第二因子")##橫軸為第一因子,縱軸為第二因子
abline(h=1,lty=1)
abline(v=0,lty=1)
text(fit632_var$scores,ex6.32[,1],adj=-0.05)
為更加直觀地分析各地區公用事業建設的水平,以?F1因子得分為x軸,F2因子得分為y軸畫散點圖,如圖?4所示。
?
圖4
四、實驗結果
由散點圖可知,除吐魯番市在因子?F2上的得分較大外,其他地區在?F2上的得分相差不是特別大,說明吐魯番的養殖牲畜方面是有一些優勢的,而在其他地區不適合養殖牲畜。在較為綜合的因子F1上,得分最高的是昌吉,說明昌吉在養殖各方面都很突出。F1的得分較高的烏魯木齊,哈密市,烏蘇市,阿克蘇市,阜康市。另外,F1的得分較低的地區有克拉瑪依市,塔城市,喀什市,奎屯市,伊寧市,阿勒泰市,和田市,阿圖什市,庫兒勒市,博樂市。一方面這些地區地廣人稀,在這邊的人特別少,因此養殖業不是特別的發達;因此,政府要鼓勵人們養殖發家致富,這些地方不適合種植農作物,適合養殖牲畜,政府也要出臺相應的政策來對以下家庭進行扶持。
二、實驗內容
按現行統計報表制度,農村居民可支配收入主要由四部分構成,即工資性收人、經營凈收人、財產凈收入、轉移凈收入。表?9?列出了?2018?年全國?31?個省、直轄市、自治區農村居民人均可支配收入的數據(數據來源于?2019?年《中國統計年鑒》),試進行對應分析,揭示全國農村居民人均可支配收入的特征以及各省、直轄市、自治區與各收入類型間的關系。
表9
| 地區 | 工資性收入 | 經驗凈收入 | 財產凈收入 | 轉移凈收入 |
| 北京 | 19826.71 | 2021.743 | 1876.849 | 2764.994 |
| 天津 | 13568.08 | 5334.594 | 921.5624 | 3240.988 |
| 河北 | 7454.096 | 4611.55 | 298.7112 | 1666.532 |
| 山西 | 5735.751 | 3075.233 | 192.9316 | 2746.096 |
| 內蒙古 | 2896.641 | 7180.689 | 520.3909 | 3204.841 |
| 遼寧 | 5644.759 | 6263.842 | 334.4825 | 2413.244 |
| 吉林 | 3521.494 | 7756.244 | 256.5462 | 2213.891 |
| 黑龍江 | 3009.1 | 7053.345 | 679.0009 | 3062.208 |
| 上海 | 19503.49 | 1753.214 | 1003.204 | 8114.821 |
| 江蘇 | 10221.62 | 6016.581 | 767.5393 | 3839.327 |
| 浙江 | 16898.37 | 6676.973 | 784.0952 | 2942.934 |
| 安徽 | 5057.992 | 5411.485 | 256.0305 | 3270.515 |
| 福建 | 8214.715 | 6705.625 | 322.4504 | 2578.398 |
| 江西 | 6120.982 | 5271.867 | 235.4591 | 2831.583 |
| 山東 | 6550.045 | 7193.601 | 428.9783 | 2124.372 |
| 河南 | 5335.616 | 4790.713 | 221.3923 | 3483.023 |
| 湖北 | 4886.791 | 6270.848 | 185.9417 | 3634.24 |
| 湖南 | 5769.335 | 4785.686 | 179.3366 | 3358.152 |
| 廣東 | 8510.675 | 4432.666 | 448.9283 | 3775.468 |
| 廣西 | 3691.364 | 5393.41 | 241.3528 | 3108.641 |
| 海南 | 5611.359 | 5806.061 | 253.6796 | 2317.777 |
| 重慶 | 4847.78 | 4812.921 | 334.7712 | 3785.752 |
| 四川 | 4311.011 | 5117.185 | 379.4569 | 3523.724 |
| 貴州 | 4276.231 | 3226.708 | 126.2265 | 2086.94 |
| 云南 | 3259.859 | 5599.01 | 187.2304 | 1721.815 |
| 西藏 | 3037.154 | 5888.91 | 427.1768 | 2096.577 |
| 陜西 | 4620.79 | 3507.959 | 196.5996 | 2887.487 |
| 甘肅 | 2534.719 | 3823.725 | 211.5428 | 2234.144 |
| 青海 | 3047.252 | 3904.631 | 463.1075 | 2978.351 |
| 寧夏 | 4547.847 | 4638.489 | 362.7769 | 2158.53 |
| 新疆 | 2945.188 | 6623.889 | 235.1426 | 2170.281 |
三、實驗過程
rm(list=ls())
ex7.2<-read.table(file.choose(),head=TRUE,fileEncoding="utf8")##讀取數據
dat72<-ex7.2[,-1]##不要數據的第一列
rownames(dat72)<-ex7.2[,1]##確定列名
library(FactoMineR)##調用函數
fit_ca<-FactoMineR::CA(dat72,graph=FALSE)
##方差解釋
fit_ca$eig
##行主成分輪廓坐標
FF<-fit_ca$row$coord
##列主成分輪廓坐標
GG<-fit_ca$col$coord
##散點圖
plot(FF[,1],FF[,2],xlab="輪廓1",ylab="輪廓2",xlin=c(-0.8,0.8),ylin=c(-0.3,0.3))
text(FF[,1],FF[,2],rownames(dat72),adj=1.3)
points(GG[,1]GG[,2],PCH=15)
text(GG[,1],GG[,2],colnames(dat72),adj=-0.2,col="red",cex=1.5)
?
圖5
四、實驗結果
從散點圖不難看出,我國經濟發達地區,如浙江、江蘇、天津、福建等,農村居民的收入來源主要以工資性收入和財產凈收入為主;青海、重慶、四川等地區多以轉移凈收入為主要收入來源;西蔽、新疆、云南、吉林等地區以經營凈收入為主。從我國目前的經濟發展狀況來看,大部分農民仍是以工資性收入和家庭經營性收入為主要的收入來源。在經濟發達地區,農民外出打工較多,因此以工資性收入為主;在經濟不發達地區,大部分農民還是以農業生產為主,因此以家庭經營性收人為主。隨著我國社會經濟不斷發展,這種格局必然會發生一定的變化,轉移性收人和財產性收入也會有所表現。
???綜上所述,對應分析方法較好地揭示了指標與指標、樣品與樣品、指標與樣品之間的內在聯系。因此,這種方法能夠以較小的代價從原始數據中提取較多的信息。
總結
以上是生活随笔為你收集整理的多元统计分析因子分析何晓群版课后作业的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [Head First Java] -
- 下一篇: Jenkins主从节点配置