R语言实战笔记 基本统计分析-相关
相關(guān)
相關(guān)系數(shù)可以用來(lái)描述定量變量之間的關(guān)系。
將使用R基礎(chǔ)安裝中的state.x77數(shù)據(jù)集,提供了美國(guó)50個(gè)州在1977年的人口、收入、文盲率、預(yù)期壽命、謀殺率和高中畢業(yè)率數(shù)據(jù)等。
數(shù)據(jù)如下:
相關(guān)的類型
Pearson、Spearman和Kendall相關(guān):
可以用cor(x, use= , method= )函數(shù)計(jì)算三種相關(guān)系數(shù)。而cov()函數(shù)可用來(lái)計(jì)算協(xié)方差。
cor和cov的參數(shù):
x:矩陣或數(shù)據(jù)框
use:指定缺失數(shù)據(jù)的處理方式。可選的方式為all.obs(假設(shè)不存在缺失數(shù)據(jù)——遇到缺失數(shù)據(jù)時(shí)將報(bào)錯(cuò))、everything(遇到缺失數(shù)據(jù)時(shí),相關(guān)系數(shù)的計(jì)算結(jié)果將被設(shè)為missing)、complete.obs(行刪除)以及pairwise.complete.obs(成對(duì)刪除,pairwise deletion)
method:指定相關(guān)系數(shù)的類型。可選類型為pearson、spearman或kendall。
> states<-state.x77[,1:6] > cov(states) > cor(states) > cor(states,method = "spearman")cov()計(jì)算了方差和協(xié)方差
第一個(gè)cor()計(jì)算了Pearson積差相關(guān)系數(shù)
第二個(gè)cor()計(jì)算了Spearman登記相關(guān)系數(shù)(可以看到收入和高中畢業(yè)率之間存在很強(qiáng)的正相關(guān),而文盲率和預(yù)期壽命之間存在很強(qiáng)的負(fù)相關(guān))
默認(rèn)情況下得到的結(jié)果是一個(gè)方陣。你同樣可以計(jì)算非方形的相關(guān)矩陣。
> x<-states[,c("Population","Income","Illiteracy","HS Grad")] > y<-states[,c("Life Exp","Murder")] > cor(x,y)偏相關(guān)
偏相關(guān)是指在控制一個(gè)或多個(gè)定量變量時(shí),另外兩個(gè)定量變量之間的相互關(guān)系。
函數(shù)格式:pcor(u , s)
u是一個(gè)數(shù)值向量,前兩個(gè)數(shù)值表示要計(jì)算相關(guān)系數(shù)的變量下標(biāo),其余的數(shù)值為條件變量(即要排除影響的變量)的下標(biāo)。
S為變量的協(xié)方差陣。
在控制了收入、文盲率和高中畢業(yè)率的影響時(shí),人口和謀殺率之間的相關(guān)系數(shù)為0.346。偏相關(guān)系數(shù)常用于社會(huì)科學(xué)的研究中。
其他類型的相關(guān)
polycor 包中的 hetcor() 函數(shù)可以計(jì)算一種混合的相關(guān)矩陣,其中包括數(shù)值型變量的Pearson積差相關(guān)系數(shù)、數(shù)值型變量和有序變量之間的多系列相關(guān)系數(shù)、有序變量之間的多分格相關(guān)系數(shù)以及二分變量之間的四分相關(guān)系數(shù)。
相關(guān)性的顯著性檢驗(yàn)
在計(jì)算好相關(guān)系數(shù)后,要進(jìn)行統(tǒng)計(jì)顯著性檢驗(yàn)。
常用原假設(shè)為變量間不相關(guān)(即總體的相關(guān)系數(shù)為0)。
- cor.test(x, y, alternative = , method = )
cor.test(x, y, alternative = , method = )對(duì)單個(gè)的Pearson、Spearman和Kendall相關(guān)系數(shù)進(jìn)行檢驗(yàn)。
x和y:要檢驗(yàn)相關(guān)性的變量;
alternative:用來(lái)指定進(jìn)行雙側(cè)檢驗(yàn)或單側(cè)檢驗(yàn)(“two.side”、“l(fā)ess”、“greater”);
method:用以指定要計(jì)算的相關(guān)類型(“pearson”、“kendall”、“spearman”);
> cor.test(states[,3],states[,5])檢驗(yàn)了預(yù)期壽命和謀殺率的Pearson相關(guān)系數(shù)為0的原假設(shè)。在一千萬(wàn)次中只會(huì)有少于一次的機(jī)會(huì)見到0.703這樣大的樣本相關(guān)度(即p=1.258e–08)。拒絕原假設(shè)。即預(yù)期壽命和
謀殺率之間的總體相關(guān)度不為0。
- corr.test()
corr.test()函數(shù)可以計(jì)算相關(guān)矩陣和顯著性水平。
use= 的取值可為 “pairwise” 或 “complete” (分別表示對(duì)缺失值執(zhí)行成對(duì)刪除或行刪除)。
method= 的取值可為 “pearson” (默認(rèn)值)、 “spearman” 或 “kendall”
> library(psych) > corr.test(states,use="complete")
這里可以看到,人口數(shù)量和高中畢業(yè)率的相關(guān)系數(shù)(–0.10)并不顯著地不為0(p=0.5)。
其他顯著性檢驗(yàn)
- pcor.test(r, q, n)
psych包中的pcor.test(r, q, n)函數(shù)可以用來(lái)檢驗(yàn)在控制一個(gè)或多個(gè)額外變量時(shí)兩個(gè)變量之間的條件獨(dú)立性。
r是由pcor()函數(shù)計(jì)算得到的偏相關(guān)系數(shù)
q是要控制的變量數(shù)(用數(shù)值表示位置)
n為樣本大小
總結(jié)
以上是生活随笔為你收集整理的R语言实战笔记 基本统计分析-相关的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 运营之旅
- 下一篇: R计算两列数据的相关系数_数据特征分析·