【统计学】三大相关系数之皮尔逊相关系数(person correlation coefficient)
生活随笔
收集整理的這篇文章主要介紹了
【统计学】三大相关系数之皮尔逊相关系数(person correlation coefficient)
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
統(tǒng)計(jì)學(xué)中的三大相關(guān)性系數(shù):pearson, spearman, kendall,他們反應(yīng)的都是兩個(gè)變量之間變化趨勢(shì)的方向以及程度,其值范圍為-1到+1。
0表示兩個(gè)變量不相關(guān),正值表示正相關(guān),負(fù)值表示負(fù)相關(guān),值越大表示相關(guān)性越強(qiáng)。
- person correlation coefficient(皮爾森相關(guān)性系數(shù))
皮爾遜相關(guān)系數(shù)通常用r或ρ表示,度量?jī)勺兞縓和Y之間相互關(guān)系(線性相關(guān))
(1)公式
皮爾森相關(guān)性系數(shù)的值等于它們之間的協(xié)方差cov(X,Y)除以它們各自標(biāo)準(zhǔn)差的乘積(σX, σY)。
(2)數(shù)據(jù)要求
a.正態(tài)分布
它是協(xié)方差與標(biāo)準(zhǔn)差的比值,并且在求皮爾森相關(guān)性系數(shù)以后,通常還會(huì)用t檢驗(yàn)之類(lèi)的方法來(lái)進(jìn)行皮爾森相關(guān)性系數(shù)檢驗(yàn),而t檢驗(yàn)是基于數(shù)據(jù)呈正態(tài)分布的假設(shè)的。
b.實(shí)驗(yàn)數(shù)據(jù)之間的差距不能太大
比如:研究人跑步的速度與心臟跳動(dòng)的相關(guān)性,如果人突發(fā)心臟病,心跳為0(或者過(guò)快與過(guò)慢),那這時(shí)候我們會(huì)測(cè)到一個(gè)偏離正常值的心跳,如果我們把這個(gè)值也放進(jìn)去進(jìn)行相關(guān)性分析,它的存在會(huì)大大干擾計(jì)算的結(jié)果的。
計(jì)算積距pearson相關(guān)系數(shù),連續(xù)性變量才可采用;
計(jì)算Spearman秩相關(guān)系數(shù),適合于定序變量或不滿(mǎn)足正態(tài)分布假設(shè)的等間隔數(shù)據(jù);
計(jì)算Kendall秩相關(guān)系數(shù),適合于定序變量或不滿(mǎn)足正態(tài)分布假設(shè)的等間隔數(shù)據(jù)。
import pandas as pd
import numpy as np#原始數(shù)據(jù)
X1=pd.Series([1, 2, 3, 4, 5, 6])
Y1=pd.Series([0.3, 0.9, 2.7, 2, 3.5, 5])X1.mean() #平均值# 3.5
Y1.mean() #2.4
X1.var() #方差#3.5
Y1.var() #2.9760000000000004X1.std() #標(biāo)準(zhǔn)差不能為0# 1.8708286933869707
Y1.std() #標(biāo)準(zhǔn)差不能為0#1.725108692227826
X1.cov(Y1) #協(xié)方差#3.0600000000000005X1.corr(Y1,method="pearson") #皮爾森相關(guān)性系數(shù) #0.948136664010285
X1.cov(Y1)/(X1.std()*Y1.std()) #皮爾森相關(guān)性系數(shù) # 0.948136664010285
寫(xiě)于2020年4月15日
base:北京
-----------------------------分享結(jié)束線------------------------------
喜歡可以關(guān)注【小豬課堂】公眾號(hào)了解更多編程小技巧
總結(jié)
以上是生活随笔為你收集整理的【统计学】三大相关系数之皮尔逊相关系数(person correlation coefficient)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Eyjafjalla
- 下一篇: NAS入门之——Windows下添加My