SPSS图文教程:正态转换的多种方法
在上一期的內(nèi)容中,我們介紹了如何利用偏度值、峰度值、直方圖、P-P圖(Q-Q圖)以及非參數(shù)檢驗的方法來對數(shù)據(jù)資料進行正態(tài)性檢驗。詳見:SPSS教程:判斷數(shù)據(jù)正態(tài)分布的超多方法!
?
當數(shù)據(jù)分布呈現(xiàn)非正態(tài)時,我們可以將原始數(shù)據(jù)作某種函數(shù)的轉(zhuǎn)換,使偏態(tài)資料正態(tài)化,從而滿足T檢驗或其他統(tǒng)計分析方法對資料的要求,這一節(jié)內(nèi)容我們將向大家介紹如何對數(shù)據(jù)資料進行正態(tài)轉(zhuǎn)換。
?
?
一、正偏態(tài)分布資料
?
1、輕度正偏態(tài)分布
?
偏度值>0,偏度值為其標準誤差的2-3倍,即Z-score=2~3,此時認為資料分布呈現(xiàn)輕度的正偏態(tài)分布,可以考慮對變量x取根號開平方的方法來進行轉(zhuǎn)換。
?
SPSS語句如下:
COMPUTE x_new = SQRT(x)
(SQRT為開平方根Square Root縮寫)
?
2、中度正偏態(tài)分布
?
偏度值>0,偏度值為其標準誤差的3倍以上,即Z-score>3,此時認為資料分布呈現(xiàn)中度的正偏態(tài)分布,可以考慮對變量x取對數(shù)來進行轉(zhuǎn)換。可以取自然對數(shù)(ln)或以10為底的對數(shù)(log10)。
?
SPSS語句如下:
COMPUTE x_new = LN(x)
COMPUTE x_new = LG10(x)?
?
注意:LG10的糾正力度較強,有時甚至會矯枉過正,將正偏態(tài)轉(zhuǎn)換為負偏態(tài),因此在進行正態(tài)轉(zhuǎn)換后一定要對該變量再次進行正態(tài)性檢驗。
?
3、重度正偏態(tài)分布
?
對于兩端波動比較大的數(shù)據(jù)資料,極端值可能產(chǎn)生較大的影響,此時可以考慮取倒數(shù)的方法來進行轉(zhuǎn)換。
?
SPSS語句如下:
COMPUTE x_new = 1/x
?
注意:根號下要求數(shù)據(jù)均為非負數(shù)(即≥0),對數(shù)要求數(shù)據(jù)均為正數(shù)(即>0),取倒數(shù)要求分母不為0, 如果變量x中出現(xiàn)上述情況,則需要先將其進行一定的轉(zhuǎn)換,如x+K或K-x,再對其取根號、對數(shù)或倒數(shù)。其中K為一個常數(shù),可以根據(jù)需要進行賦值,例如賦值為1,或取數(shù)據(jù)的最小值、最大值等。
?
二、負偏態(tài)分布資料
?
對于負偏態(tài)分布的數(shù)據(jù)資料,首先需要將負偏態(tài)資料進行反轉(zhuǎn),轉(zhuǎn)換為正偏態(tài),然后再參考正偏態(tài)分布資料的轉(zhuǎn)換方法進行轉(zhuǎn)換。
?
反轉(zhuǎn)的方法:首先找出該數(shù)據(jù)系列的最大值max,用最大值+1,再減去每個數(shù)值
?
1、輕度負偏態(tài)分布
?
SPSS語句如下:
COMPUTE x_new = SQRT(max+1-x)
?
?
剩余文章內(nèi)容<<<<<
?
?
總結(jié)
以上是生活随笔為你收集整理的SPSS图文教程:正态转换的多种方法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: web存储机制localStorage和
- 下一篇: 邻接矩阵-建立图