SPSS常用的几种统计分析
實驗1:地理數據的統計處理
實驗步驟與結果分析:
1.點擊菜單欄【文件】下拉選項框,打開已經下載好的Excel表“"D:\桌面\計量地理學實習\表2-1某地區有關農業統計數據.xls"”,如下圖所示:
2.點擊菜單欄上面的【分析】—【描述統計】—【頻率】工具,如下圖所示:
?3.將需要進行統計分析的變量選中加載到右邊,點擊確定得到如下結果(每個變量因子的頻數統計表):
4.選中【分析】—【描述統計】—【描述】工具,將需要進行統計分析的變量選中加載到右邊,如下圖所示:
5.點擊確定得到如下輸出結果(每個變量的統計參數):
?6.最后將其導出為柱狀圖,更加直觀的查看各個變量之間的統計參數差別,導出圖表如下圖所示:
?
實驗2:相關分析
實驗步驟與結果分析
1.實驗數據整理準備后加載到SPSS,如下圖所示:
在進行雙變量相關分析前,我們需要對數據進行相關性檢驗,選中菜單欄【圖形】|【回歸變量圖】
將兩個變量分別加載進來,如下圖所示:
可以看到兩者之間是屬于負相關。
4.由于我們的相關分析是兩個變量之間的分析,為此我們打開【分析】—【相關】—【雙變量】工具,將兩個變量【水土流失面積】和【土壤含氮量】加載進去,
5.從表中可以看到,水土流失面積和土壤含氮量存在相關關系,其相關系數為-0.946,呈現中度相關性,且在0.01的顯著性水平上顯著,即樣本數據中的這個相關性在總體中一樣有效。
實驗3:主成分分析
實驗步驟與結果分析:
1.數據準備,在SPSS載入“"D:\桌面\計量地理學實習\主成分分析.xlsx"”數據,如下圖所示:
2.打開【分析】|【降維】|【因子分析】工具,將數據中除了【城市】這個變量,其余變量全部添加進去,
3.點擊【描述】,勾選新打開界面的【系數】選項和【抽取】中的【碎石圖】選項(使得分析結果更為直觀),如下圖所示:
點擊確定得到主成分分析運算結果。在公因子方差(Communalities)表中,給出了因子載荷陣的初始公因子方差(Initial)和提取公因子方差(Extraction)。
?總方差解釋:
?
5.該表按順序排列出主成分得分的方差(Total),在數值上=相關系數矩陣的各個特征根λ,因此可以直接根據特征根計算每一個主成分的方差百分比和方差累計值。由圖可知,主成分是兩個,都是方差(特征根)大于1的,第一主成分占比重62.602%,第二主成分占比重23.514%,這兩個主成分達到85.116%,超過了85%,可以說用這兩個指標評價各省份的經濟可以近似代替原來的10個指標。主成分的數目可以根據相關系數矩陣的特征根來判定。相關系數矩陣的特征根剛好等于主成分的方差,而方差是變量數據蘊涵信息的重要判據之一。
?6.從碎石圖看的話也可以知道由圖直觀的看出,成分1、2包含了大部分信息,從3開始就基本趨向平穩狀態了。
7.該表是主成分載荷矩陣,每一列載荷值都顯示了各個變量與有關主成分的相關系數。以第一列為例,0.69實際上是總人口與第一個主成分的相關系數。
8.事實上,有如下關系成立:相關系數矩陣的特征根=方差貢獻=主成分得分的方差。兩個主成分可以解釋各個變量達到了最小72.9%,最大97%,如果我們將8個主成分全部提取,則主成分載荷的行平方和都等1,就是第一張表上面的起始公因子方差。到此可以明白:在Communalities中,Initial對應的是初始公因子方差,實際上是全部主成分的公因子方差,Extraction對應的是提取的主成分的公因子方差,我們提取了兩個主成分,故計算公因子方差時只考慮兩個主成分。
提取主成分的原則上要求公因子方差的各個數值盡可能接近,亦即要求它們的方差小,當公因子方差完全相等時,它們的方差為0,這就達到理想狀態。實際應用中,只要公因子方差數值彼此不相差太遠就行了。從上面給出的結果可以看出:提取兩個主成分的時候,變量客運總量(萬人)的公因子方差偏小,這暗示提取2個主成分,客運總量(萬人)方面的信息可能有較多的損失。至于方差貢獻,反映對應主成分的重要程度。
總結,決定主成分數目的3個原則:1.只取λ>1的特征根對應的主成分;2.累計百分比達到80%~85%以上的λ值對應的主成分;3.根據特征根變化的突變點決定主成分的數量;
9.接下來根據得到的特征值和主成分載荷值(需要復制到excel表中整理在SPSS打開)計算每一個變量的特征向量,打開【轉換】|【計算變量】工具,在目標變量中輸入新的名字,輸入公式:V1(第一主成分的載荷值)/SQRT(第一主成分的特征值6.26),對于第二主成分計算其特征向量也是一樣的操作。
10.兩個主成分的特征向量計算結果:
將Ui與10個變量的標準化值相乘即可得到兩個主成分Y1、Y2的表達式:
Y1=0.28*X1+0.06X2+0.24X3+0.34X4+0.19X5+0.38X6+0.36X7+0.38X8+0.38X9+0.38X10
Y2=0.42*X1-0.55X2+0.44X3-0.21X4+0.44X5-0.03X6-0.22X7-0.12X8-0.01X9-0.17X10
實驗4:因子分析
實驗步驟與結果分析:
1.數據準備,在SPSS載入“"D:\桌面\計量地理學實習\因子分析.xlsx"”數據。
2.打開【分析】|【降維】|【因子分析】工具,將數據中除了【城市】這個變量,其余變量全部添加進去,
3.分別點擊【描述】、【抽取】和【旋轉】中的相關選項,如下圖所示:
4.從運行結果上可以看到KMO值為0.762,接近于1,說明這些數據適合進行因子分析。同時Bartlett球形度檢驗中的Sig值為0.000,小于顯著水平0.05,說明變量之間存在相關關系,可以做因子分析。
公因子方差最小值為0.73,所有的變量都可以使用公因子進行表達。
這是旋轉成份矩陣。
實驗5:聚類分析
實驗步驟與結果分析:
1.數據準備,在SPSS載入“"D:\桌面\計量地理學實習\聚類分析.xlsx"”數據。
2.打開【分析】|【分類】|【系統聚類】工具,將數據中所有的變量全部添加進去,并且設置相關選項的設置,具體如下圖所示:
2.首先給出的是樣品處理摘要(CaseProcessingSummary)。摘要告訴我們如下內容:有效樣品的數目和百分比,缺失樣品的數目和百分比,全部樣品的數目和百分比。由于沒有數據缺失,故全部21個樣本參與聚類,有效樣品為100%。
3.從進度表可以看出,第1階段(Stage1),首先將第12號樣品和第13號樣品聚為一類,這兩個樣品的夾角余弦值最大,為623.445。
4.根據樹形圖,選擇適當的尺度分為若干類。然后對分類結果進行分析,考察結果是否符合實際。
實驗6:多元線性回歸分析
實驗步驟與結果分析:
1.數據準備,在SPSS載入“"D:\桌面\計量地理學實習\多元線性回歸分析.xlsx"”數據。
打開【分析】|【回歸】|【線性】工具,將數據中所有的變量全部添加進去,并且設置相關選項的設置,具體如下圖所示:
3.相關選項設置如下圖所示:
將標準化殘差“*ZRESID”選入“Y”中,將標準化預測值“*ZPRED”選入“X”中,勾選直方圖和正態概率圖,點擊繼續。
4.結果解讀
由表可知DW值接近于2,自變量的自相關性不明顯,模型設計得好,調整后的R方為0.99,模型擬合度非常好。
顯著性表示自變量對因變量的影響程度,小于0.05表示于顯著影響,越小影響越大,由表可以知道年降水量和年蒸發量對徑流深度有顯著影響。
VIF用于共線性診斷(變量之間的關聯度),當0<VIF<10時,不存在多重共線性,由表可知年降水量和年蒸發量之間不存在多重共線性。
但是根據直方圖可以知道直方圖和正態曲線較為不吻合,說明殘差不符合正態分布。
實驗7:馬爾可夫分析
實驗步驟與結果分析:
1.時間序列數據整理后加載到Excel中,如下圖所示:
?其中E1、E2和E3分別使用1、2和3代替,年份統一使用1-40代替,
2.為了計算狀態的轉移矩陣,我使用二維折線圖直觀顯示3個狀態隨著年份之間的相互轉變:
由圖可知,
?從而得到初始轉移矩陣
?3.2004年是E2狀態,也就是2,預測2030年的農業收成,需要求出26步轉移矩陣,為此我們需要計算初始轉移矩陣的26次方,如下圖所示:
?經過專業軟件計算初始轉移矩陣的26次方結果為:
4.由于2004年的狀態向量為(7/13,2/13,4/13),也就是(0.538,0.154,0.308),求出26年后的狀態向量:
計算結果為(0.365,0.353,0.282),為此可以知道在2030年的農業收成狀態大概率是E1(很好)。
總結
以上是生活随笔為你收集整理的SPSS常用的几种统计分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: IDEA的依赖包报红问题
- 下一篇: 计算机基础知识经典问答题,计算机基础知识