「协方差」与「相关系数」的概念
一、協(xié)方差:
可以通俗的理解為:兩個(gè)變量在變化過(guò)程中是同方向變化?還是反方向變化?同向或反向程度如何?
你變大,同時(shí)我也變大,說(shuō)明兩個(gè)變量是同向變化的,這時(shí)協(xié)方差就是正的。
你變大,同時(shí)我變小,說(shuō)明兩個(gè)變量是反向變化的,這時(shí)協(xié)方差就是負(fù)的。
從數(shù)值來(lái)看,協(xié)方差的數(shù)值越大,兩個(gè)變量同向程度也就越大。反之亦然。
咱們從公式出發(fā)來(lái)理解一下:
公式簡(jiǎn)單翻譯一下是:如果有X,Y兩個(gè)變量,每個(gè)時(shí)刻的“X值與其均值之差”乘以“Y值與其均值之差”得到一個(gè)乘積,再對(duì)這每時(shí)刻的乘積求和并求出均值(其實(shí)是求“期望”,但就不引申太多新概念了,簡(jiǎn)單認(rèn)為就是求均值了)。
下面舉個(gè)例子來(lái)說(shuō)明吧:
比如有兩個(gè)變量X,Y,觀察t1-t7(7個(gè)時(shí)刻)他們的變化情況。
簡(jiǎn)單做了個(gè)圖:分別用紅點(diǎn)和綠點(diǎn)表示X、Y,橫軸是時(shí)間。可以看到X,Y均圍繞各自的均值運(yùn)動(dòng),并且很明顯是同向變化的。
總結(jié)一下,如果協(xié)方差為正,說(shuō)明X,Y同向變化,協(xié)方差越大說(shuō)明同向程度越高;如果協(xié)方差為負(fù),說(shuō)明X,Y反向運(yùn)動(dòng),協(xié)方差越小說(shuō)明反向程度越高。
--------LINE---------
一般的同學(xué)看到above the line的內(nèi)容就ok了。但有一些愛鉆研的同學(xué),可能會(huì)進(jìn)一步提問(wèn):
另外,如果你還鉆牛角尖,說(shuō)如果t1,t2,t3……t7時(shí)刻X,Y都在增大,而且X都比均值大,Y都比均值小,這種情況協(xié)方差不就是負(fù)的了?7個(gè)負(fù)值求平均肯定是負(fù)值啊?但是X,Y都是增大的,都是同向變化的,這不就矛盾了?
這個(gè)更好解釋了:這種情況不可能出現(xiàn)!
因?yàn)?#xff0c;你的均值算錯(cuò)了……
好了,現(xiàn)在,對(duì)于協(xié)方差應(yīng)該有點(diǎn)感覺了吧?
二、相關(guān)系數(shù):
對(duì)于相關(guān)系數(shù),我們從它的公式入手。一般情況下,相關(guān)系數(shù)的公式為:
翻譯一下:就是用X、Y的協(xié)方差除以X的標(biāo)準(zhǔn)差和Y的標(biāo)準(zhǔn)差。
所以,相關(guān)系數(shù)也可以看成協(xié)方差:一種剔除了兩個(gè)變量量綱影響、標(biāo)準(zhǔn)化后的特殊協(xié)方差。
既然是一種特殊的協(xié)方差,那它:
1、也可以反映兩個(gè)變量變化時(shí)是同向還是反向,如果同向變化就為正,反向變化就為負(fù)。
2、由于它是標(biāo)準(zhǔn)化后的協(xié)方差,因此更重要的特性來(lái)了:它消除了兩個(gè)變量變化幅度的影響,而只是單純反應(yīng)兩個(gè)變量每單位變化時(shí)的相似程度。
比較抽象,下面還是舉個(gè)例子來(lái)說(shuō)明:
這是為什么呢?
因?yàn)橐陨蟽煞N情況下,在X、Y兩個(gè)變量同向變化時(shí),X變化的幅度不同,這樣,兩種情況的協(xié)方差更多的被變量的變化幅度所影響了。
所以,為了能準(zhǔn)確的研究?jī)蓚€(gè)變量在變化過(guò)程中的相似程度,我們就要把變化幅度對(duì)協(xié)方差的影響,從協(xié)方差中剔除掉。于是,相關(guān)系數(shù)就橫空出世了,就有了最開始相關(guān)系數(shù)的公式:
所以標(biāo)準(zhǔn)差描述了變量在整體變化過(guò)程中偏離均值的幅度。協(xié)方差除以標(biāo)準(zhǔn)差,也就是把協(xié)方差中變量變化幅度對(duì)協(xié)方差的影響剔除掉,這樣協(xié)方差也就標(biāo)準(zhǔn)化了,它反應(yīng)的就是兩個(gè)變量每單位變化時(shí)的情況。這也就是相關(guān)系數(shù)的公式含義了。
同時(shí),你可以反過(guò)來(lái)想象一下:既然相關(guān)系數(shù)是協(xié)方差除以標(biāo)準(zhǔn)差,那么,當(dāng)X或Y的波動(dòng)幅度變大的時(shí)候,它們的協(xié)方差會(huì)變大,標(biāo)準(zhǔn)差也會(huì)變大,這樣相關(guān)系數(shù)的分子分母都變大,其實(shí)變大的趨勢(shì)會(huì)被抵消掉,變小時(shí)也亦然。于是,很明顯的,相關(guān)系數(shù)不像協(xié)方差一樣可以在+∞+\infty+∞ 到?∞-\infty?∞間變化,它只能在+1到-1之間變化(相關(guān)系數(shù)的取值范圍在+1到-1之間變化可以通過(guò)施瓦茨不等式來(lái)證明,有些復(fù)雜,這里就不贅述了,有興趣的可以google下)。
總結(jié)一下,對(duì)于兩個(gè)變量X、Y,
當(dāng)他們的相關(guān)系數(shù)為1時(shí),說(shuō)明兩個(gè)變量變化時(shí)的正向相似度最大,即,你變大一倍,我也變大一倍;你變小一倍,我也變小一倍。也即是完全正相關(guān)(以X、Y為橫縱坐標(biāo)軸,可以畫出一條斜率為正數(shù)的直線,所以X、Y是線性關(guān)系的)。
隨著他們相關(guān)系數(shù)減小,兩個(gè)變量變化時(shí)的相似度也變小,當(dāng)相關(guān)系數(shù)為0時(shí),兩個(gè)變量的變化過(guò)程沒有任何相似度,也即兩個(gè)變量無(wú)關(guān)。
當(dāng)相關(guān)系數(shù)繼續(xù)變小,小于0時(shí),兩個(gè)變量開始出現(xiàn)反向的相似度,隨著相關(guān)系數(shù)繼續(xù)變小,反向相似度會(huì)逐漸變大。
當(dāng)相關(guān)系數(shù)為-1時(shí),說(shuō)明兩個(gè)變量變化的反向相似度最大,即,你變大一倍,我變小一倍;你變小一倍,我變大一倍。也即是完全負(fù)相關(guān)(以X、Y為橫縱坐標(biāo)軸,可以畫出一條斜率為負(fù)數(shù)的直線,所以X、Y也是線性關(guān)系的)。
好了,講了這么多,不知你看完是否對(duì)相關(guān)系數(shù)也有了一些感覺?
原文作者GRAYLAMB
https://www.zhihu.com/question/20852004
總結(jié)
以上是生活随笔為你收集整理的「协方差」与「相关系数」的概念的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: wifi万能钥匙app怎么用
- 下一篇: 在git bush中如何退出vim编辑器