日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

多元统计分析因子分析何晓群版课后作业

發布時間:2023/12/10 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 多元统计分析因子分析何晓群版课后作业 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、實驗目的

因子分析模型是主成分分析的推廣。它也是利用降維的思想,從研究原始變量相關矩陣內部的依賴關系出發,把一些具有錯綜復雜關系的變量歸結為少數幾個綜合因子的一種多變量統計分析方法。將數據整理,找出變量間的相關性,通過因子分析從而對數據進行分析。

、實驗內容

1,區域公用事業的發展是地區綜合發展的重要組成部分,是促進社會發展的重要因素。因此,分析評價全國?31?個省、直轄市、自治區在城市公共交通、市政、設施等各方面的建設,把握各地區公用事業的整體發展水平具有重要意義。下面應用因子分析模型,選取反映城市公用事業建設的?12?個指標作為原始變量,對全國各地區公用事業的整體發展水平做分析評價這?12?個指標分別為?X1:城區面積(平方公里);X2:建成區面積(平方公里);X3:人均公園綠地面積(平方米);X4:城市建設用地面積(平方公里);X5:年末實有道路長度(公里);X6:年末實有道路面積(萬平方米);X7:城市排水管道長度(公里);X8:城市道路照明燈(千盞);X9:年末公共交通車輛運營數(輛);X10:運營線路總長度(公里);X11:每萬人擁有公共交通車輛(標臺);X12:出租汽車數量(輛)。原始數據來源于?2017?年《中國統計年鑒》。參見表1。

表1 2016年區域公共事業指標數據

地區

x1

x2

x3

x4

x5

x6

x7

x8

x9

x10

x11

x12

北京 ???????????????

16410

1419.7

16.01

1463.8

8086

14316

16901

300.6

27892

20392

24.31

68484

天津 ???????????????

2583.3

1007.9

10.59

961.7

7888

14466

20951

353.1

13655

17932

18.09

31940

河北 ???????????????

6613.4

2056.5

14.31

1944.9

14418

33252

17954

753.1

21479

26077

13.68

53034

山西 ???????????????

2893.3

1157.6

11.86

1129

7671

16705

8169

543.3

8895

13813

9.42

30690

內蒙古 ?????????????

4871.7

1241.6

19.77

1146.9

9728

20808

12971

756.6

8000

16495

10.26

45499

遼寧 ???????????????

15148.1

2798.2

11.33

2718.2

16394

29277

18275

1282.6

22950

26222

12.91

80743

吉林 ???????????????

5111.5

1425.8

13.37

1379.5

10669

17084

8445

527.9

11670

13267

10.26

56413

黑龍江 ?????????????

2735.6

1810.2

11.91

1821.8

12750

19667

10722

646

16939

20256

13.58

64158

上海 ???????????????

6340.5

998.8

7.83

1913.3

5129

10582

19508

559.1

20718

24787

12.7

47271

江蘇 ???????????????

15277.6

4299.3

14.79

4367.4

44999

79733

72823

3510.4

41131

62726

16.57

53376

浙江 ???????????????

11311.8

2673.3

13.17

2573.4

21215

41286

40550

1526.3

32551

70040

16.27

37781

安徽 ???????????????

6100.4

2001.7

14.02

1959.7

14154

33100

26388

1015

14605

14785

11.95

39199

福建 ???????????????

4440.9

1469.2

13.08

1365.6

8656

17657

14329

723.3

16238

23563

15.26

21727

江西 ???????????????

2369.3

1371

14.16

1279.3

8977

18936

13326

686.7

8136

14311

8.86

13712

山東 ???????????????

22424.2

4795.5

17.91

4540

40685

83011

56796

1869.8

47419

82149

15.88

61314

河南 ???????????????

4822.8

2544.3

10.43

2424.6

13140

31621

21376

897.5

22955

20840

10.88

46598

湖北 ???????????????

8334.2

2248.9

10.99

2111.8

18622

33293

23922

746.9

20915

18826

12.76

36415

湖南 ???????????????

4373.1

1625.6

10.57

1511.1

12292

22477

13846

697.2

19363

17779

15.13

26173

廣東 ???????????????

17086.3

5808.1

17.87

5266.6

38930

71204

56323

2596.8

63670

102707

14.2

68504

廣西 ???????????????

5752

1333.8

11.77

1292.6

8585

18555

11480

677.3

9093

13143

9.77

17337

海南 ???????????????

1428.2

321

12.02

302.1

2503

5195

4192

173.7

3080

5866

11.35

6683

重慶 ???????????????

7438.5

1350.7

16.86

1179.6

8498

17776

15553

569.6

12810

14565

10.7

21100

四川 ???????????????

7872.7

2615.6

12.47

2468.5

14835

31352

26486

1189.1

23583

24910

12.9

33394

貴州 ???????????????

3104.8

844.6

14.98

776.9

4022

8208

6060

473.6

6565

8656

11.36

19021

云南 ???????????????

3127.7

1131.3

11.33

1027.2

5995

14768

13133

514.8

11166

20821

13.17

19130

西藏 ???????????????

449.8

145.2

7.84

186.8

1134

1986

1422

60.2

580

1035

6.2

1882

陜西 ???????????????

2334.8

1127.4

12.3

1096.3

6783

15265

8678

653.9

12696

10542

16.01

24458

甘肅 ???????????????

1580.1

870.4

13.94

806

4668

9933

5802

306.9

5233

6429

9.16

23395

青海 ???????????????

688.2

197.4

10.78

176

1019

2059

1744

122.1

2248

3039

14.49

8344

寧夏 ???????????????

2119.2

441.8

18.3

384.1

2214

6578

1626

258.3

3357

5019

13.47

12504

新疆 ???????????????

3034.9

1199.4

12.22

1187

7791

13673

6864

631.5

9250

8429

15.24

32284

三、實驗過程

第?1?步:讀人數據,進行?KMO?檢驗和?Bartlett?檢驗。結果顯示該例的數據非常適合做因子分析。

ex6.3<-read.table(file.choose(),head=TRUE,fileEncoding="utf8")##找到文件6.3賦值給ex6.3

dat63<-ex6.3[,-1]##不要數據的第一列賦值給dat63

rownames(dat63)<-ex6.3[,1]##提取ex6.3中的第一列

dat63<-scale(dat63,center=TRUE,scale=TRUE)##將數據標準化

library(psych)##調用這個psych這個函數

psych::KMO(r=dat63)##對dat63進行KMO檢驗

cortest.bartlett(cor(dat63))##進行Bartlett?檢驗

##得出下面這些數據

$chisq##卡方分布

[1] 2453.293

$p.value##p值

[1] 0

$df##自由度

[1] 66

第2?步:選擇因子個數。方差解釋表和碎石圖(見圖?2)顯示,前三個公共因子總的方差貢獻率為?90.8%,基本提取了樣本所包含的信息;隨著公共因子個數大于?3,碎石圖中曲線的變化趨勢明顯趨于平穩,因此確定選擇三個公共因子。

###方差解釋

fit63_var<-psych::principal(dat63,nfactors=3,rotate='varimax',covar=TRUE)##求出方差

lam63<-fit63_var$values###特征值

cumlam63<-cumsum(lam63)/sum(lam63)##求出比列

VE63<-data.frame(lam63,lam63/sum(lam63),cumlam63)##求出累計貢獻率

colnames(VE63)<-c("特征值","比例","累計比例")##行名為這些

Z<-round(VE63,3)##保留三位小數

Write.csv(z)

表 2

特征值

比例

累計比例

1

8.98

0.748

0.748

2

1.049

0.087

0.836

3

0.866

0.072

0.908

4

0.551

0.046

0.954

5

0.215

0.018

0.972

6

0.155

0.013

0.985

7

0.075

0.006

0.991

8

0.056

0.005

0.996

9

0.032

0.003

0.998

10

0.011

0.001

0.999

11

0.006

0

1

12

0.004

0

1

##碎石圖

?

圖1 碎石圖

第?3?步:因子載荷和因子得分。為便于解釋公共因子的實際意義,旋轉載荷矩陣表中給出了進行方差最大化正交旋轉后的因子載荷。可以看出,第一個公共因子?F?1主要由?X2建成區面積、X4城市建設用地面積、X5年末實有道路長度、X6年末實有道路面積、X7城市排水管道長度、X8城市道路照明燈、X9年末公共交通車輛運營數、X10運營線路總長度決定,而且各指標對?F1的貢獻基本相當。X2,X4是反映城市基礎建設的指標,X5,X6,X7,X8是反映城市市政設施建設的指標,X9,X10是反映公共交通建設的指標。因此,F1是相對綜合的因子,基本反映了城市公共建設的整體水平。第二個公共因子?F2主要由每萬人擁有公共交通車輛決定,主要反映公共交通的建設水平,擁有的公共交通車輛越多,公民的出行越便利。第三個公共因子?F3主要由人均公園綠地面積決定,主要反映城市基礎建設的情況。

##因子載荷

load63<-as.matrix.data.frame(fit63_var$loadings)##將其轉化為矩陣

rownames(load63)<-colnames(dat63)##確定列名

x<-round(load63,3)##輸出表格

write.csv(x,"2.csv")

表3

V1

V2

V3

x1

0.743

0.5

0.239

x2

0.948

0.21

0.153

x3

0.204

0.096

0.972

x4

0.957

0.24

0.083

x5

0.952

0.178

0.168

x6

0.951

0.15

0.196

x7

0.93

0.217

0.113

x8

0.933

0.093

0.135

x9

0.876

0.413

0.097

x10

0.889

0.248

0.176

x11

0.093

0.922

0.07

x12

0.541

0.592

0.059

c<-round(fit63_var$scores,3)

write.csv(c,"3.csv")

表4

RC1

RC2

RC3

北京

-1.203

3.851

0.924

天津

-0.651

1.192

-0.926

河北

0.057

0.389

0.301

山西

-0.214

-0.878

-0.347

內蒙古

-0.524

-0.613

2.443

遼寧

0.556

0.962

-0.856

吉林

-0.261

-0.178

0.075

黑龍江

-0.151

0.586

-0.621

上海

-0.005

0.493

-2.013

江蘇

2.655

-0.033

0.034

浙江

0.959

0.556

-0.189

安徽

0.232

-0.406

0.254

福建

-0.363

0.282

0.022

江西

-0.117

-1.481

0.515

山東

2.18

0.644

1.31

河南

0.581

-0.407

-1.154

湖北

0.429

-0.059

-0.827

湖南

-0.127

0.346

-0.925

廣東

2.744

0.154

0.984

廣西

-0.081

-0.997

-0.312

海南

-0.875

-0.701

-0.104

重慶

-0.388

-0.693

1.495

四川

0.543

-0.205

-0.368

貴州

-0.756

-0.582

0.854

云南

-0.381

-0.182

-0.532

西藏

-0.486

-1.854

-1.532

陜西

-0.65

0.504

-0.247

甘肅

-0.601

-1.034

0.467

青海

-1.147

0.095

-0.568

寧夏

-1.32

-0.229

2.121

新疆

-0.638

0.477

-0.276

##圖2

plot(fit63_var$scores,pch="o",xlab="第一因子",ylab="第二因子")##橫軸為第一因子,縱軸為第二因子

abline(h=1,lty=1)

abline(v=0,lty=1)

text(fit63_var$scores,ex6.3[,1],adj=-0.05)##顯示名字

為更加直觀地分析各地區公用事業建設的水平,以?F1因子得分為x軸,F2因子得分為y軸畫散點圖,如圖?2?所示。

?

圖2 因子的散點圖

四、實驗結果

由散點圖可知,除北京在因子?F2?上的得分較大外,其他地區在?F2上的得分相差不是特別大,說明北京的公共交通極其便利,在其他地區中上海的公共交通最便利,西藏的公共交通建設最差,很明顯,西藏地區的公共交通建設主要受地理因素的影響。在較為綜合的因子F1上,得分最高的是廣東,說明廣東省公用事業的綜合發展水平較高,基礎設施建設比較全面,但公共交通建設有待進一步加強。F1的得分較高的地區還有江蘇、山東、浙江、河南,其中江蘇和浙江地區的經濟發展水平也較高,說明這些地區的發展相對比較全面,人民的生活質量可以較好地得到保障。另外,F1的得分較低的地區有寧夏、青海、海南、貴州、陜西、新疆。一方面這些地區的經濟發展水平相對較低;另一方面這些地區所處的環境相對較差,可能會對公用事業建設產生較大影響。因此,全國各地區若要全面協調發展,國家應加大對西部地區的投資和幫扶力度,促進西部地區的發展。

1.研究目的:

為研究新疆各地、州、市、縣總產肉量。我們從《新疆統計年鑒2013》上收集到各地區的總產肉量數據來進行因子分析。具體數據如下:

2.多元變量的選擇與數據:

:牛(噸) ??:馬(噸) ??:駱駝(噸) ?:豬(噸)山羊(噸) :綿羊(噸) :禽肉(噸) ?:兔肉(噸)

表5

地區

x1

x2

x3

x4

x5

x6

x7

烏魯木齊

18613

2084

323

18133

4409

13630

7352

克拉瑪依市

504

15

1700

9040

192

562

535

吐魯番市

3750

50

4300

1725

1454

12785

1210

哈密市

5491

73

66

5223

2402

11956

2244

昌吉市

19362

1068

22

42043

2767

15901

19372

阜康市

10560

478

38

15347

2363

10118

14925

伊寧市

4985

580

0

3676

179

2466

1690

奎屯市

60

24

500

4090

16

142

294

塔城市

5283

1050

400

1396

692

6131

1520

烏蘇市

8340

1890

88

13088

3215

9197

1542

阿勒泰市

9645

962

96

504

454

5126

442

博樂市

1938

157

3

3955

216

3002

1177

庫爾勒市

2366

2

300

6059

571

4461

6440

阿克蘇市

10530

224

4

14264

1858

8805

17036

阿圖什市

6210

285

5

580

1324

5396

2000

喀什市

6549

222

6

3600

111

14437

2074

和田市

2548

7899

7

1537

63

5148

4816

三、實驗過程

第?1?步:讀人數據,進行?KMO?檢驗和?Bartlett?檢驗。結果顯示該例的數據非常適合做因子分析。

ex6.32<-read.table(file.choose(),head=TRUE,fileEncoding="utf8")##找到文件6.32賦值給ex6.32

dat632<-ex6.32[,-1]##不要數據的第一列賦值給dat632

rownames(dat632)<-ex6.32[,1]##提取ex6.32中的第一列

dat632<-scale(dat632,center=TRUE,scale=TRUE)##將數據標準化

library(psych)##調用這個psych這個函數

psych::KMO(r=dat632)##對dat632進行KMO檢驗

Kaiser-Meyer-Olkin factor adequacy

Call: psych::KMO(r = dat632)

Overall MSA = ?0.76

MSA for each item =

x1 ??x2 ??x3 ??x4 ??x5 ??x6 ??x7

0.76 0.50 0.36 0.78 0.84 0.78 0.78

cortest.bartlett(cor(dat632))##進行Bartlett?檢驗

##得出下面這些數據

$chisq

[1] 390.463

$p.value

[1] 8.699204e-70

$df

[1] 21

第2?步:選擇因子個數。方差解釋表和碎石圖(見圖?3)顯示,前三個公共因子總的方差貢獻率為?82.8%,基本提取了樣本所包含的信息;隨著公共因子個數大于?3,碎石圖中曲線的變化趨勢明顯趨于平穩,因此確定選擇三個公共因子。

###方差解釋

fit632_var<-psych::principal(dat632,nfactors=3,rotate='varimax',covar=TRUE)##求出方差

lam632<-fit632_var$values###特征值

cumlam632<-cumsum(lam632)/sum(lam632)##求出比列

VE632<-data.frame(lam632,lam632/sum(lam632),cumlam632)##求出累計貢獻率

colnames(VE632)<-c("特征值","比例","累計比例")

z<-round(VE632,3)

write.csv(z,"1.csv")

表6

特征值

比例

累計比例

1

3.663

0.523

0.523

2

1.245

0.178

0.701

3

0.890

0.127

0.828

4

0.574

0.082

0.910

5

0.324

0.046

0.957

6

0.174

0.025

0.982

7

0.129

0.018

1.000

plot(lam632,type="o",xlab="因子序號",ylab="特征值")

?

圖3

第?3?步:因子載荷和因子得分。為便于解釋公共因子的實際意義,旋轉載荷矩陣表中給出了進行方差最大化正交旋轉后的因子載荷。可以看出,第一個公共因子?F?1主要由?X1牛、X4豬、X5山羊、X6綿羊決定,而且各指標對?F1的貢獻基本相當。說明這些是新疆主要肉產品;第二個公共因子?F2主要由駱駝決定,主要反映該地區主要是沙漠,駱駝在這邊易生存。第三個公共因子?F3主要由馬決定,主要反映該地區易于飼養馬匹情況。

##因子載荷

load632<-as.matrix.data.frame(fit632_var$loadings)##轉化為矩陣

rownames(load632)<-colnames(dat632)##確定列名

x<-round(load632,3)

write.csv(x,"2.csv")

表7

V1

V2

V3

x1

0.918

-0.187

0.041

x2

0.003

-0.120

0.981

x3

-0.060

0.918

-0.137

x4

0.846

-0.269

-0.119

x5

0.861

0.097

0.040

x6

0.841

0.280

0.075

x7

0.760

-0.387

-0.066

c<-round(fit632_var$scores,3)

write.csv(c,"3.csv")

表8

RC1

RC2

RC3

烏魯木齊

1.738

0.387

0.779

克拉瑪依市

-0.930

0.496

-0.731

吐魯番市

0.205

3.512

-0.211

哈密市

0.219

0.338

-0.217

昌吉市

2.397

-0.853

-0.321

阜康市

0.913

-0.593

-0.400

伊寧市

-0.827

-0.628

-0.303

奎屯市

-1.206

-0.348

-0.673

塔城市

-0.529

0.050

0.104

烏蘇市

0.505

0.182

0.612

阿勒泰市

-0.511

-0.267

0.075

博樂市

-0.935

-0.539

-0.518

庫爾勒市

-0.547

-0.443

-0.661

阿克蘇市

0.773

-0.863

-0.618

阿圖什市

-0.438

-0.240

-0.270

喀什市

-0.092

0.176

-0.165

和田市

-0.735

-0.369

3.519

plot(fit632_var$scores,pch="o",xlab="第一因子",ylab="第二因子")##橫軸為第一因子,縱軸為第二因子

abline(h=1,lty=1)

abline(v=0,lty=1)

text(fit632_var$scores,ex6.32[,1],adj=-0.05)

為更加直觀地分析各地區公用事業建設的水平,以?F1因子得分為x軸,F2因子得分為y軸畫散點圖,如圖?4所示。

?

圖4

四、實驗結果

由散點圖可知,除吐魯番市在因子?F2上的得分較大外,其他地區在?F2上的得分相差不是特別大,說明吐魯番的養殖牲畜方面是有一些優勢的,而在其他地區不適合養殖牲畜。在較為綜合的因子F1上,得分最高的是昌吉,說明昌吉在養殖各方面都很突出。F1的得分較高的烏魯木齊,哈密市,烏蘇市,阿克蘇市,阜康市。另外,F1的得分較低的地區有克拉瑪依市,塔城市,喀什市,奎屯市,伊寧市,阿勒泰市,和田市,阿圖什市,庫兒勒市,博樂市。一方面這些地區地廣人稀,在這邊的人特別少,因此養殖業不是特別的發達;因此,政府要鼓勵人們養殖發家致富,這些地方不適合種植農作物,適合養殖牲畜,政府也要出臺相應的政策來對以下家庭進行扶持。

、實驗內容

按現行統計報表制度,農村居民可支配收入主要由四部分構成,即工資性收人、經營凈收人、財產凈收入、轉移凈收入。表?9?列出了?2018?年全國?31?個省、直轄市、自治區農村居民人均可支配收入的數據(數據來源于?2019?年《中國統計年鑒》),試進行對應分析,揭示全國農村居民人均可支配收入的特征以及各省、直轄市、自治區與各收入類型間的關系。

表9

地區

工資性收入

經驗凈收入

財產凈收入

轉移凈收入

北京

19826.71

2021.743

1876.849

2764.994

天津

13568.08

5334.594

921.5624

3240.988

河北

7454.096

4611.55

298.7112

1666.532

山西

5735.751

3075.233

192.9316

2746.096

內蒙古

2896.641

7180.689

520.3909

3204.841

遼寧

5644.759

6263.842

334.4825

2413.244

吉林

3521.494

7756.244

256.5462

2213.891

黑龍江

3009.1

7053.345

679.0009

3062.208

上海

19503.49

1753.214

1003.204

8114.821

江蘇

10221.62

6016.581

767.5393

3839.327

浙江

16898.37

6676.973

784.0952

2942.934

安徽

5057.992

5411.485

256.0305

3270.515

福建

8214.715

6705.625

322.4504

2578.398

江西

6120.982

5271.867

235.4591

2831.583

山東

6550.045

7193.601

428.9783

2124.372

河南

5335.616

4790.713

221.3923

3483.023

湖北

4886.791

6270.848

185.9417

3634.24

湖南

5769.335

4785.686

179.3366

3358.152

廣東

8510.675

4432.666

448.9283

3775.468

廣西

3691.364

5393.41

241.3528

3108.641

海南

5611.359

5806.061

253.6796

2317.777

重慶

4847.78

4812.921

334.7712

3785.752

四川

4311.011

5117.185

379.4569

3523.724

貴州

4276.231

3226.708

126.2265

2086.94

云南

3259.859

5599.01

187.2304

1721.815

西藏

3037.154

5888.91

427.1768

2096.577

陜西

4620.79

3507.959

196.5996

2887.487

甘肅

2534.719

3823.725

211.5428

2234.144

青海

3047.252

3904.631

463.1075

2978.351

寧夏

4547.847

4638.489

362.7769

2158.53

新疆

2945.188

6623.889

235.1426

2170.281

三、實驗過程

rm(list=ls())

ex7.2<-read.table(file.choose(),head=TRUE,fileEncoding="utf8")##讀取數據

dat72<-ex7.2[,-1]##不要數據的第一列

rownames(dat72)<-ex7.2[,1]##確定列名

library(FactoMineR)##調用函數

fit_ca<-FactoMineR::CA(dat72,graph=FALSE)

##方差解釋

fit_ca$eig

##行主成分輪廓坐標

FF<-fit_ca$row$coord

##列主成分輪廓坐標

GG<-fit_ca$col$coord

##散點圖

plot(FF[,1],FF[,2],xlab="輪廓1",ylab="輪廓2",xlin=c(-0.8,0.8),ylin=c(-0.3,0.3))

text(FF[,1],FF[,2],rownames(dat72),adj=1.3)

points(GG[,1]GG[,2],PCH=15)

text(GG[,1],GG[,2],colnames(dat72),adj=-0.2,col="red",cex=1.5)

?

圖5

四、實驗結果

從散點圖不難看出,我國經濟發達地區,如浙江、江蘇、天津、福建等,農村居民的收入來源主要以工資性收入和財產凈收入為主;青海、重慶、四川等地區多以轉移凈收入為主要收入來源;西蔽、新疆、云南、吉林等地區以經營凈收入為主。從我國目前的經濟發展狀況來看,大部分農民仍是以工資性收入和家庭經營性收入為主要的收入來源。在經濟發達地區,農民外出打工較多,因此以工資性收入為主;在經濟不發達地區,大部分農民還是以農業生產為主,因此以家庭經營性收人為主。隨著我國社會經濟不斷發展,這種格局必然會發生一定的變化,轉移性收人和財產性收入也會有所表現。
???綜上所述,對應分析方法較好地揭示了指標與指標、樣品與樣品、指標與樣品之間的內在聯系。因此,這種方法能夠以較小的代價從原始數據中提取較多的信息。

總結

以上是生活随笔為你收集整理的多元统计分析因子分析何晓群版课后作业的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。