日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

R语言:关于我国各地区消费水平的聚类分析

發布時間:2023/12/10 编程问答 50 豆豆
生活随笔 收集整理的這篇文章主要介紹了 R语言:关于我国各地区消费水平的聚类分析 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、研究方法

此次研究中主要用的是系統聚類法與K-means聚類法。
系統聚類可以對變量或樣品進行聚類,變量可以為連續或分離變量,提供的距離測量方法和結果表示也非常豐富。該方法的原理是先將所有n個變量或觀測看成不同的n類,然后將性質最接近的兩類合并為一類;再從這n-1類中找到最接近的兩類加以合并,以此類推,直到所有的變量或觀測被合為一類。
K-means聚類需要先隨機選取K個對象作為初始的聚類中心。然后計算每個對象與各個種子聚類中心之間的距離,把每個對象分配給距離它最近的聚類中心。聚類中心以及分配給它們的對象就代表一個聚類。一旦全部對象都被分配了,每個聚類的聚類中心會根據聚類中現有的對象被重新計算。

二、實證分析

數據來源

地區居民消費水平差異的測度方法有單一指標法和綜合指標法2種方法.居民消費水平不僅僅體現在人均消費性支出等單一指標,居民生活消費的各個具體指標等也是居民消費水平的重要體現.因此,文章選擇綜合法分析我國城鎮居民消費水平的差異,以我國31個省市為研究對象,以中國統計年鑒2005年的各地區城鎮居民家庭平均每人全年消費性支出統計數據為基礎,選取食品、衣著、家庭設備用品及服務、醫療保健、交通和通信、教育文化、居住娛樂服務、雜項商品和服務等8個方面的指標,構建聚類分析模型。

模型構建

數據文件的建立

導入數據并查詢數據結構

根據上圖可以看出此次聚類的數據結構,除“地區”數據之外,其余數據全為數值型數據

匯總變量信息

由上圖可以看出各個變量的最小值,第一四分位數,中位數,均值,第三四分位數與最大值。

數據預處理

需要提取聚類的變量

由上圖可以看到此次需要用到的聚類變量。

判斷是否存在缺失值

由上圖可以看出此次選取的數據不存在缺失值,因此不需要在進行缺失值處理,但需要進一步判斷是否存在較多的異常值

判斷是否存在異常值

由上圖各變量的折線圖可以看出各個變量變化較為平穩,無較大的波動和異常值情況。

由各變量箱線圖可以看出,此次選用的數據存在部分的異常值,但異常值較少,可以接受并進行聚類分析。

數據挖掘

系統聚類:

通過計算變量間的“歐氏距離”,利用“重心法”計算觀測點與小類間的距離,進行系統聚類。

上圖為系統聚類的譜系圖,由譜系圖可以看出分三類比較合適,其中,上海、廣東、北京、浙江地區為第一類;海南、云南、安徽、陜西、內蒙古、吉林、甘肅、新疆、河北、青海、寧夏、河南、山西、黑龍江、湖北、江西、貴州、山東、湖南、遼寧、廣西、四川、天津、福建、江蘇、重慶地區為第二類;西藏地區為第三類。

由上圖可以看出隨著聚類數目的不斷減少,最小類間距離不斷增大。當聚類數目達成3類之后,最小類間距離的變化幅度很大,說明類間的差異較大,不應再繼續合并。所以,根據碎石圖粗略判斷聚成3類較為合適

通過計算可以的出聚類為三類,第一類為4個地區,第二類為26個地區,第三類為1個地區。

上圖為聚類的聚類解,可以看出系統聚類將數據分為三類以及各地區的類別。

數據解讀:
在系統聚類分析中,將數據分為了3類,各類樣本量依次為4,26,1。第一類地區消費支出最大,其次為第二類,第三類地區消費支出最少。
即第一類總體消費區間為(11809.87,13773.41),第二類總體消費區間為(5928.79,9653.26),第三類總體消費為8617.11。

K-means聚類:

經過初步的系統聚類可以得出將數據分為三類,為了更地對比兩種聚類方法的差異,在進行K-means聚類時,將初步指定聚類個數為3類。

通過K-means聚類可以得出將數據分為三類,第一類為4個地區,第二類為5個地區,第三類為22個地區。

上圖的數據為聚類的結果,可以看出每一個變量的聚類中心。

上圖為聚類的聚類解,可以看出K-means聚類將數據分為三類以及各地區的類別。

上圖為各類聚類變量均值的變化折線圖,可以從圖中看出第三類地區的消費水平小于第二類地區小于第一類地區,說明我國東部沿海地區以及少數中西部地區的消費水平較高,而大部分中西部地區的經濟消費水平較低,存在一定的貧富差距。

數據解讀:

在K均值聚類分析中,將數據分為了3類,各類樣本量依次為4,5,22。第一類地區消費支出最大,其次為第二類,第三類地區消費支出最少。
即第一類總體消費區間為(11809.87,13773.41),第二類總體消費區間為(8617.11,9653.26),第三類總體消費區間為(5928.79,7504.99)。
雖然系統聚類與K-Means聚類都將數據劃分為三類,所劃分的地區卻完全不同,這是兩種聚類方法原理上的差異所導致的。因此,在數據分析過程中采用不同方法進行反復研究是非常必要的。

四、結論

此次研究利用了東中西部城鎮居民統計數據,實證分析了經濟體制改革對不同地區居民消費行為的影響,結論是經濟體制改革對中西部地區城鎮居民消費行為影響明顯,且影響程度從東到西逐漸減弱。隨著消費水平的提高各省市在反映生活水平高低的重要指標食品支出方面雖然在總量上呈下降趨勢,但對于總消費支出的比重卻呈不斷上升趨勢,在衣著、居住方面的支出也有相同的變化趨勢;在家庭設備、醫療保健、交通通信、娛樂文教等方面的支出無論是總量還是比重都呈現出不斷下降的趨勢。由此可以看出,隨著經濟水平和消費水平的不斷提高,人們不僅物質生活質量不斷提高,而且更加注重精神文化生活方面的消費,再保證生存的基礎上,更注重發展型和享受型消費,消費結構逐漸趨向合理化。我國居民總體消費水平還不高,中西部地區的大部分省市消費水平仍處于較低水平。

總結

以上是生活随笔為你收集整理的R语言:关于我国各地区消费水平的聚类分析的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。