概率统计笔记: 协方差与相关系数
1 協(xié)方差
1.1 定義
假設(shè)兩個隨機變量X和Y滿足未知的概率分布,那么X和Y的協(xié)方差為:
其中E是求解數(shù)學(xué)期望的運算符,μx,μy分別是X和Y的均值
1.2 存在的問題
????????協(xié)方差告訴我們兩個隨機變量是如何一起移動的,但只用協(xié)方差衡量變量相關(guān)性存在一些問題:協(xié)方差是有量綱的,它的大小受隨機變量本身取值范圍的影響。
2 相關(guān)系數(shù)
????????人們希望使用某個和協(xié)方差有關(guān),但是又是無量綱的測量來描述兩個隨機變量的相關(guān)性。
????????最簡單的做法就是用變量自身的波動對協(xié)方差進行標(biāo)準(zhǔn)化,相關(guān)系數(shù)便由此得來。
2.1 相關(guān)系數(shù)的定義
? ? ? ??令ρ表示X和Y的相關(guān)系數(shù),它的定義為
? ? ? ? 其中σx和σy分別是X和Y的標(biāo)準(zhǔn)差
????????通過使用X和Y的標(biāo)準(zhǔn)差對它們的協(xié)方差歸一化,ρ的取值范圍為 [-1, +1]:?
2.2 相關(guān)系數(shù)和XY分布之間的關(guān)系
-
ρ(X,Y)=1表示X和Y之間存在確切的線性正相關(guān);
-
ρ(X,Y)=0表示X和Y之間不存在任何線性相關(guān)性;
-
ρ(X,Y)=-1表示X和Y之間存在確切的線性負(fù)相關(guān)。
????????值得一提的是,相關(guān)系數(shù)僅僅刻畫 X和Y之間的線性相關(guān)性;它不描述它們之間的(任何)非線性關(guān)系。
3 時間序列的自相關(guān)系數(shù)
3.1 時間序列的弱平穩(wěn)性
算法筆記:ARIMA_UQI-LIUWJ的博客-CSDN博客?提及了弱平穩(wěn)性
我們這里涉及的弱平穩(wěn)性性質(zhì)是:如果時間序列數(shù)據(jù)具有弱平穩(wěn)性,那么對于所有的時刻t和任意的間隔k,值之間的協(xié)方差,其中γk與時間t無關(guān)。他僅僅依賴于時間間隔k。
(比如樣本是 {},那么)
3.2 自相關(guān)系數(shù)ACF
和的自相關(guān)系數(shù)稱為的間隔為k的自相關(guān)系數(shù)。
?當(dāng)k=0的時候,有:
說明對任何時刻t,?的間隔為k的自相關(guān)系數(shù)恒為1?
?進一步,我們計算
?
【弱平穩(wěn)性的性質(zhì),時間序列的期望不變】
這里的是 {},
?所以?
【注:也有很多版本底下除的是n,就不太明白究竟應(yīng)該是哪個。。。但如果n很大h很小的時候,差距并不是很大】
3.2.1 自相關(guān)圖解讀
下面為一些時間序列的自相關(guān)圖。它們呈現(xiàn)出完全不同結(jié)構(gòu)的自相關(guān)性。
?
這個自相關(guān)圖的時間序列存在明顯的趨勢
這個相關(guān)圖的時間序列存在明顯的周期性。
?
?這個則同時有一定的趨勢和周期性
總結(jié)
以上是生活随笔為你收集整理的概率统计笔记: 协方差与相关系数的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python 笔记:装饰器
- 下一篇: 错误处理: pip install 时候