日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程语言 > python >内容正文

python

python 变量聚类 proc varclus_使用SAS进行简单的聚类分析讲解(转载)

發(fā)布時間:2023/12/14 python 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python 变量聚类 proc varclus_使用SAS进行简单的聚类分析讲解(转载) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

聚類分析的目的是把分類對象按一定的規(guī)則分成若干類,這些類不是事先給定的,而是根據(jù)數(shù)據(jù)的特征確定的,對類的數(shù)目和類的結(jié)構(gòu)不必作任何的假定。在同一類里的這些對象在某種意義上傾向于彼此相似,而在不同類里的對象傾向于彼此不相似。

聚類分析根據(jù)分類對象不同分為Q型聚類分析和R型聚類分析。Q型聚類是指對樣品進行聚類,R型聚類分析是指對變量進行聚類。

SAS中用于判別分析的過程主要有以下四個:

PROC CLUSTER 譜系聚類(Q型聚類分析)

PROC FASTCLUS K均值快速聚類,適用于大樣本(Q型聚類分析)

PROC MODECLUS 非參數(shù)聚類(Q型聚類分析)

PROC VARCLUS 變量聚類(R型聚類分析)

1. 用PROC CLUSTER進行樣品聚類分析(Q型聚類分析)

[例1]試根據(jù)1997年信息基礎(chǔ)設(shè)施的發(fā)展情況,對世界20個國家和地區(qū)進行聚類分析。描述信息基礎(chǔ)設(shè)施的變量主要有六個:

Cal-每千人擁有電話線數(shù);

Cellphone-每千戶居民移動電話數(shù);

Fee-高峰時期每三分鐘國際電話成本;

Computer-每千人擁有的計算機數(shù);

Mips-每千人中計算機功率(每秒百萬指令);

Net-每千人互聯(lián)網(wǎng)絡(luò)戶主數(shù)。

data cluster1;

infile datalines;

input Country $ Cal Cellphone Fee Computer Mips Net;

datalines;

美國 631.6 161.9 0.36 403 26073 35.34

日本 498.4 143.2 3.57 176 10223 6.26

德國 557.6 70.6 2.18 199 11571 9.48

瑞典 684.1 281.8 1.4 286 16660 29.39

瑞士 644 93.5 1.98 234 13621 22.68

丹麥 620.3 248.6 2.56 296 17210 21.84

新加坡 498.4 147.5 2.5 284 13578 13.49

中國臺灣 469.4 56.1 3.68 119 6911 1.72

韓國 434.5 73 3.36 99 5795 1.66

巴西 81.9 16.3 3.02 19 876 0.52

智利 138.6 8.2 1.4 31 1411 1.28

墨西哥 92.2 9.8 2.61 31 1751 0.35

俄羅斯 174.9 5 5.12 24 1101 0.48

波蘭 169 6.5 3.68 40 1796 1.45

匈牙利 262.2 49.4 2.66 68 3067 3.09

馬來西亞 195.5 88.4 4.19 53 2734 1.25

泰國 78.6 27.8 4.95 22 1662 0.11

印度 13.6 0.3 6.28 2 101 0.01

法國 559.1 42.9 1.27 201 11702 4.76

英國 521.1 122.5 0.98 248 14461 11.91

;

run;

PROC CLUSTER DATA=cluster1 STANDARD METHOD=CENTROID CCC PSEUDO UT=TREE;

PROC TREE DATA=TREE HORIZONTAL SPACES=1;

RUN;

[說明]

METHOD=的選項可以為:

AVERAGE(平均法)

CENTROID(重心法)

COMPLETE(最長距離法)

DENSITY(非參數(shù)概率密度估計法)

EML(最大似然法)

FLEXIBLE(flexible-beta法)

MCQUITTY(Mcquitty的相似分析法)

MEDIAN(中位數(shù)法)

SINGLE(最短距離法)

TWOSTAGE(兩階段密度法)

WARD(Ward最小方差法)

STANDARD 對變量實施標(biāo)準(zhǔn)化。

CCC、PSEUDO 為了計算一些統(tǒng)計量用以判別全部樣品究竟聚成幾類較為合適。CCC要求打印聚類判別據(jù)的立方及在一致無效假設(shè)下近似期望值R2,PSEUDO要求打印偽F(標(biāo)志PSF)和t2(標(biāo)志PST2)統(tǒng)計量。當(dāng)分類數(shù)目不同時,它們就有不同的取值,CCC和PSF出現(xiàn)峰值所對應(yīng)的分類數(shù)較合適、PST2出現(xiàn)峰值的前一行所對應(yīng)的分類數(shù)較合適。

OUT=TREE 產(chǎn)生名為TREE的輸出數(shù)據(jù)集,它可被TREE過程用來輸出聚類結(jié)果的樹狀圖。HORIZONTAL要求將樹狀圖水平放置,SPACES=1要求各樣品之間的間隔為1。

[結(jié)果及其解釋]

如果聚為3類,其聚類結(jié)果為:一類是信息基礎(chǔ)設(shè)施最為發(fā)達的美國,一類是一些發(fā)達國家,其他的國家和地區(qū)聚為另外一類。

2. 用PROC FASTCLUS進行大樣本的樣品聚類分析(Q型聚類分析)

處理大樣本時一般采用非分層聚類法(快速聚類法)。聚類的個數(shù)k可以根據(jù)需要事先指定。與分層聚類方法相比,非分層聚類方法不必確定距離矩陣,不必存儲基本數(shù)據(jù),因此適用于處理很大的數(shù)據(jù)集。

下面仍使用[例1]的數(shù)據(jù),對PROC FASTCLUS加以說明:

PROC FASTCLUS DATA=cluster1 UT=result MAXC=3 CLUSTER=c;

RUN;

[說明]

MAXC=3 要求總共聚為3類

OUT=result 結(jié)果輸出到數(shù)據(jù)集result

CLUSTER=c 分類標(biāo)志的變量名c,其取值為1,2,3

[結(jié)果及其解釋]

聚類結(jié)果為:一類是信息基礎(chǔ)設(shè)施最為發(fā)達的美國,一類是一些發(fā)達國家,其他的國家和地區(qū)聚為另外一類。

3. 用 PROC VARCLUS 進行變量聚類分析(R型聚類分析)

[例 2] 對1996年全國30個省市自治區(qū)經(jīng)濟發(fā)展基本情況的八項指標(biāo)作變量聚類分析:

X1:GDP

X2:居民消費水平

X3:固定資產(chǎn)投資

X4:職工平均工資

X5:貨物周轉(zhuǎn)量

X6:居民消費價格指數(shù)

X7:商品零售價格指數(shù)

X8:工業(yè)總產(chǎn)值

data cluster2;

infile datalines;

input Province $ X1-X8;

datalines;

北京 1394.89 2505 519.01 8144 373.9 117.3 112.6 843.43

天津 920.11 2720 345.46 6501 342.8 115.2 110.6 582.51

河北 2849.52 1258 704.87 4839 2033.3 115.2 115.8 1234.85

山西 1092.48 1250 290.9 4721 717.3 116.9 115.6 697.25

內(nèi)蒙 832.88 1387 250.23 4134 781.7 117.5 116.8 419.39

遼寧 2793.37 2397 387.99 4911 1371.1 116.1 114 1840.55

吉林 1129.2 1872 320.45 4430 497.4 115.2 114.2 762.47

黑龍江 2014.53 2334 435.73 4145 824.8 116.1 114.3 1240.37

上海 2462.57 5343 996.48 9279 207.1 118.7 113 1642.95

江蘇 5155.25 1926 1434.95 5943 1025.5 115.8 114.3 2026.64

浙江 3524.79 2249 1006.39 6619 754.4 116.6 113.5 916.59

安徽 2003.58 1254 474 4609 908.3 114.8 112.7 824.14

福建 2160.52 2320 553.97 5857 609.3 115.2 114.4 433.67

江西 1205.11 1182 282.84 4211 411.7 116.9 115.9 571.84

山東 5002.34 1527 1229.55 5145 1196.6 117.6 114.2 2207.69

河南 3002.74 1034 670.35 4344 1574.4 116.5 114.9 1367.92

湖北 2391.42 1527 571.86 4685 849 120 116.6 1220.72

湖南 2195.7 1408 422.61 4797 1011.8 119 115.5 843.83

廣東 5381.72 2699 1639.83 8250 656.5 114 111.6 1396.35

廣西 1606.15 1314 382.59 5105 556 118.4 116.4 554.97

海南 364.17 1814 198.35 5340 232.1 113.5 111.3 64.33

四川 3534 1261 822.54 4645 902.3 118.5 117 1431.81

貴州 630.07 942 150.84 4475 301.1 121.4 117.2 324.72

云南 1206.68 1261 334 5149 310.4 121.3 118.1 716.65

西藏 55.98 1110 17.87 7382 4.2 117.3 114.9 5.57

陜西 1000.03 1208 300.27 4396 500.9 119 117 600.98

甘肅 553.35 1007 114.81 5493 507 119.8 116.5 468.79

青海 165.31 1445 47.76 5753 61.6 118 116.3 105.8

寧夏 169.75 1355 61.98 5079 121.8 117.1 115.3 114.4

新疆 834.57 1469 376.95 5348 339 119.7 116.7 428.76

;

run;

PROC VARCLUS DATA=cluster2 CENTROID MAXC=3;

VAR x1-x8;

RUN;

[說明]

CENTROID 聚類方法為重心法,默認(rèn)聚類方法為主成分法

MAXC=3 要求總共聚為3類

[結(jié)果及其解釋]

聚類結(jié)果為:第一類變量主要反映了生產(chǎn)狀況;第二類變量主要反映了消費狀況,第三類變量主要反映了價格狀況。

來自 “ ITPUB博客 ” ,鏈接:http://blog.itpub.net/31491/viewspace-598177/,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任。

總結(jié)

以上是生活随笔為你收集整理的python 变量聚类 proc varclus_使用SAS进行简单的聚类分析讲解(转载)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 成人免费视频免费观看 | 精品视频一区二区三区 | 在线播放日韩av | 免费h漫禁漫天天堂 | 国产精品自产拍在线观看 | 麻豆视频在线观看 | 香蕉国产999 | 伊人狠狠操 | 欧美性猛交性大交 | 夜夜狠狠擅视频 | 国产精品欧美一区喷水 | 日韩在线| 中文字幕大全 | 中文字幕成人av | a级片在线免费看 | 免费欧美黄色片 | 狼人综合伊人 | 亚洲精品免费在线 | 日日碰狠狠躁久久躁蜜桃 | 成人免费在线 | 色婷婷香蕉在线一区二区 | 国产三级直播 | 国产精品电影在线观看 | 国产三级理论 | 一本色道久久综合狠狠躁 | av一起看香蕉 | 爱情岛亚洲论坛入口福利 | 99精品无码一区二区 | 亚色av| 国产精品无码网站 | av动漫在线免费观看 | 五月开心网 | www嫩草| 老女人毛片50一60岁 | 91视频黄版| 97香蕉久久超级碰碰高清版 | 亚洲电影一区二区 | 操夜夜操 | 亚洲精品国产熟女久久久 | xxx毛片| 美女福利视频在线 | 久久亚洲综合国产精品99麻豆精品福利 | 性奶老妇 视频 | 亚洲一区二区三区免费在线观看 | 久射久| 久久成人18免费观看 | 欧美a级片视频 | 密臀av| 中文字幕在线播放不卡 | 精品人妻一区二区三区久久嗨 | 日本三级中国三级99人妇网站 | 无码国产69精品久久久久网站 | 中文字幕一区二区精品 | 污网站在线免费 | 国产av自拍一区 | 日本一级淫片免费放 | 免费在线黄| 欧美日韩成人在线 | 美女脱光内衣内裤 | 亚洲精品无码久久 | 黄色网入口 | 国产成人精品视频一区二区 | 91n在线观看| 黄色三级小视频 | 成人另类小说 | 国产精品九九九 | 99精品人妻少妇一区二区 | 亚洲精品乱码久久久久久蜜桃欧美 | 亚洲美女视频一区 | 激情伊人网 | 污片免费网站 | 亚洲成人影音 | 国产免费一区二区三区四区五区 | 欧美cccc极品丰满hd | 97视频国产| 69色 | 色哟哟网站在线观看 | 夜夜躁日日躁狠狠久久av | 欧美熟妇一区二区 | 国产成人精品免费网站 | 99视频在线免费 | 中文天堂在线观看 | 免费看黄网站在线观看 | 午夜av中文字幕 | 亚洲欧美日韩中文字幕在线观看 | 欧美精品黑人猛交高潮 | 亚洲精品国产精品乱码不卡√香蕉 | 一区二区三区国产在线观看 | 国产粉嫩在线 | 韩日视频 | 国产中文字幕免费 | 一级大片儿 | 深夜视频在线观看免费 | 久久亚洲综合国产精品99麻豆精品福利 | 亚洲91精品 | 99爱99| 国产精品久久久久久久一区二区 | 青青免费在线视频 | 日本aa视频 |