【统计学】三大相关系数之皮尔逊相关系数(person correlation coefficient)
生活随笔
收集整理的這篇文章主要介紹了
【统计学】三大相关系数之皮尔逊相关系数(person correlation coefficient)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
統計學中的三大相關性系數:pearson, spearman, kendall,他們反應的都是兩個變量之間變化趨勢的方向以及程度,其值范圍為-1到+1。
0表示兩個變量不相關,正值表示正相關,負值表示負相關,值越大表示相關性越強。
- person correlation coefficient(皮爾森相關性系數)
皮爾遜相關系數通常用r或ρ表示,度量兩變量X和Y之間相互關系(線性相關)
(1)公式
皮爾森相關性系數的值等于它們之間的協方差cov(X,Y)除以它們各自標準差的乘積(σX, σY)。
(2)數據要求
a.正態分布
它是協方差與標準差的比值,并且在求皮爾森相關性系數以后,通常還會用t檢驗之類的方法來進行皮爾森相關性系數檢驗,而t檢驗是基于數據呈正態分布的假設的。
b.實驗數據之間的差距不能太大
比如:研究人跑步的速度與心臟跳動的相關性,如果人突發心臟病,心跳為0(或者過快與過慢),那這時候我們會測到一個偏離正常值的心跳,如果我們把這個值也放進去進行相關性分析,它的存在會大大干擾計算的結果的。
計算積距pearson相關系數,連續性變量才可采用;
計算Spearman秩相關系數,適合于定序變量或不滿足正態分布假設的等間隔數據;
計算Kendall秩相關系數,適合于定序變量或不滿足正態分布假設的等間隔數據。
import pandas as pd
import numpy as np#原始數據
X1=pd.Series([1, 2, 3, 4, 5, 6])
Y1=pd.Series([0.3, 0.9, 2.7, 2, 3.5, 5])X1.mean() #平均值# 3.5
Y1.mean() #2.4
X1.var() #方差#3.5
Y1.var() #2.9760000000000004X1.std() #標準差不能為0# 1.8708286933869707
Y1.std() #標準差不能為0#1.725108692227826
X1.cov(Y1) #協方差#3.0600000000000005X1.corr(Y1,method="pearson") #皮爾森相關性系數 #0.948136664010285
X1.cov(Y1)/(X1.std()*Y1.std()) #皮爾森相關性系數 # 0.948136664010285
寫于2020年4月15日
base:北京
-----------------------------分享結束線------------------------------
喜歡可以關注【小豬課堂】公眾號了解更多編程小技巧
總結
以上是生活随笔為你收集整理的【统计学】三大相关系数之皮尔逊相关系数(person correlation coefficient)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Eyjafjalla
- 下一篇: NAS入门之——Windows下添加My