日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

pearson相关系数_Pearson(皮尔逊)相关系数

發(fā)布時間:2023/12/4 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 pearson相关系数_Pearson(皮尔逊)相关系数 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

由于使用的統(tǒng)計相關(guān)系數(shù)比較頻繁,所以這里就利用幾篇文章簡單介紹一下這些系數(shù)。

相關(guān)系數(shù):考察兩個事物(在數(shù)據(jù)里我們稱之為變量)之間的相關(guān)程度。

如果有兩個變量:X、Y,最終計算出的相關(guān)系數(shù)的含義可以有如下理解:

(1)、當相關(guān)系數(shù)為0時,X和Y兩變量無關(guān)系。

(2)、當X的值增大(減小),Y值增大(減小),兩個變量為正相關(guān),相關(guān)系數(shù)在0.00與1.00之間。

(3)、當X的值增大(減小),Y值減小(增大),兩個變量為負相關(guān),相關(guān)系數(shù)在-1.00與0.00之間。

相關(guān)系數(shù)的絕對值越大,相關(guān)性越強,相關(guān)系數(shù)越接近于1或-1,相關(guān)度越強,相關(guān)系數(shù)越接近于0,相關(guān)度越弱。

通常情況下通過以下取值范圍判斷變量的相關(guān)強度:
相關(guān)系數(shù)???0.8-1.0?????極強相關(guān)
???????????????? 0.6-0.8???? 強相關(guān)
???????????????? 0.4-0.6???? 中等程度相關(guān)
???????????????? 0.2-0.4???? 弱相關(guān)
???????????????? 0.0-0.2???? 極弱相關(guān)或無相關(guān)

皮爾森(pearson)相關(guān)系數(shù)

在這三大相關(guān)系數(shù)中,spearman和kendall屬于等級相關(guān)系數(shù)亦稱為“秩相關(guān)系數(shù)”,是反映等級相關(guān)程度的統(tǒng)計分析指標。今天暫時用不到,所以現(xiàn)在只做pearson的相關(guān)研究。

??? 首先放上公式:

???? 公式定義為:?兩個連續(xù)變量(X,Y)的pearson相關(guān)性系數(shù)(Px,y)等于它們之間的協(xié)方差cov(X,Y)除以它們各自標準差的乘積(σX,σY)。系數(shù)的取值總是在-1.0到1.0之間,接近0的變量被成為無相關(guān)性,接近1或者-1被稱為具有強相關(guān)性。

根據(jù)以上公式,python3實現(xiàn)代碼:

def pearson(vector1, vector2):

n = len(vector1)

#simple sums

sum1 = sum(float(vector1[i]) for i in range(n))

sum2 = sum(float(vector2[i]) for i in range(n))

#sum up the squares

sum1_pow = sum([pow(v, 2.0) for v in vector1])

sum2_pow = sum([pow(v, 2.0) for v in vector2])

#sum up the products

p_sum = sum([vector1[i]*vector2[i] for i in range(n)])

#分子num,分母den

num = p_sum - (sum1*sum2/n)

den = math.sqrt((sum1_pow-pow(sum1, 2)/n)*(sum2_pow-pow(sum2, 2)/n))

if den == 0:

return 0.0

return num/den

現(xiàn)在,用兩個向量測試一下:

vector1 = [2,7,18,88,157,90,177,570]

vector2 = [3,5,15,90,180, 88,160,580]

運行結(jié)果為0.998,可見這兩組數(shù)是高度正相關(guān)的。

此外,從上面的公式我們知道,皮爾森相關(guān)性系數(shù)是協(xié)方差與標準差的比值,所以它對數(shù)據(jù)是有比較高的要求的:

第一, 實驗數(shù)據(jù)通常假設(shè)是成對的來自于正態(tài)分布的總體。為啥通常會假設(shè)為正態(tài)分布呢?因為我們在求皮爾森相關(guān)性系數(shù)以后,通常還會用t檢驗之類的方法來進行皮爾森相關(guān)性系數(shù)檢驗,而 t檢驗是基于數(shù)據(jù)呈正態(tài)分布的假設(shè)的。

第二, 實驗數(shù)據(jù)之間的差距不能太大,或者說皮爾森相關(guān)性系數(shù)受異常值的影響比較大。例如心跳與跑步的例子,萬一這個人的心臟不太好,跑到一定速度后承受不了,突發(fā)心臟病,那這時候我們會測到一個偏離正常值的心跳(過快或者過慢,甚至為0),如果我們把這個值也放進去進行相關(guān)性分析,它的存在會大大干擾計算的結(jié)果的。

總結(jié)

以上是生活随笔為你收集整理的pearson相关系数_Pearson(皮尔逊)相关系数的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。