时间序列与R语言应用(part1)--时间序列基本概念
學(xué)習(xí)筆記
參考書目:《計(jì)量經(jīng)濟(jì)學(xué)》、《計(jì)量經(jīng)濟(jì)學(xué)模型及R語言應(yīng)用》、《時(shí)間序列分析及應(yīng)用R語言》
時(shí)間序列分析之基本概念
時(shí)間序列的含義
從統(tǒng)計(jì)上來說,時(shí)間序列就是將某一個(gè)指標(biāo)在不同時(shí)間上的不同數(shù)值,按照時(shí)間的先后順序排列而成的序列。
從數(shù)學(xué)意義上講,設(shè)X(t)(t∈T)X(t)(t\in T)X(t)(t∈T)是一個(gè)隨機(jī)過程,Xi(i=1,2,...,n)X_{i}(i=1,2,...,n)Xi?(i=1,2,...,n)是在時(shí)刻iii對過程X(t)X(t)X(t)的觀測值,則Xi(i=1,2,...,n)X_{i}(i=1,2,...,n)Xi?(i=1,2,...,n)稱為一次樣本實(shí)現(xiàn),也就是一個(gè)時(shí)間序列。
從系統(tǒng)意義上來說,時(shí)間序列就是某一系統(tǒng)在不同時(shí)間(地點(diǎn)、條件等)的響應(yīng)。這個(gè)定義不僅指出時(shí)間序列是按照一定順序排列而成的,而且這里的一定順序不一定是指時(shí)間順序,也可以是具有各種不同意義的物理量。
時(shí)間序列的分類
- 按研究對象的多少分類:單變量時(shí)間序列和多變量時(shí)間序列。
多變量時(shí)間序列不僅描述了各個(gè)變量的變化規(guī)律,而且揭示了各變量間的相互依存關(guān)系的動(dòng)態(tài)規(guī)律性。
-
按時(shí)間的連續(xù)性分類:離散時(shí)間序列和連續(xù)時(shí)間序列
-
按序列的統(tǒng)計(jì)特性分類:平穩(wěn)時(shí)間序列和非平穩(wěn)時(shí)間序列
隨機(jī)過程是否具有平穩(wěn)性對于時(shí)間序列預(yù)測十分重要,這一性質(zhì)保證了隨機(jī)過程的結(jié)構(gòu)不會(huì)隨著時(shí)間變化,這是準(zhǔn)確預(yù)測的必要條件。
- 按時(shí)間序列的分布規(guī)律分類:高斯時(shí)間序列和非高斯時(shí)間序列
服從高斯分布的時(shí)間序列叫高斯時(shí)間序列,否則為非高斯時(shí)間序列。對于某些非高斯時(shí)間序列,往往可以經(jīng)過適當(dāng)變換,近似看成高斯時(shí)間序列。
平穩(wěn)和非平穩(wěn)
- 平穩(wěn)隨機(jī)過程
假設(shè)某一時(shí)間序列是由某個(gè)隨機(jī)過程生成的,即假定時(shí)間序列Xt(t=1,2,...,n)X_{t}(t=1,2,...,n)Xt?(t=1,2,...,n)的每個(gè)數(shù)值都是從一個(gè)概率分布中隨機(jī)得到的,如果XtX_{t}Xt?滿足下列條件:
①均值E(Xt)=μE(X_{t})=\muE(Xt?)=μ,均值是與時(shí)間ttt無關(guān)的常數(shù)
②方差Var(Xt)=σ2Var(X_{t})=\sigma^2Var(Xt?)=σ2,方差是與時(shí)間ttt無關(guān)的常數(shù)
③協(xié)方差Cov(Xt,Xt+k)=γkCov(X_{t},X_{t+k})=\gamma_kCov(Xt?,Xt+k?)=γk?,協(xié)方差只與時(shí)間間隔kkk有關(guān).
則稱該隨機(jī)時(shí)間序列是款平穩(wěn)的,該隨機(jī)過程是一個(gè)平穩(wěn)隨機(jī)過程。
- 白噪聲
舉個(gè)平穩(wěn)時(shí)間序列的例子:白噪聲
最簡單的隨機(jī)時(shí)間序列XtX_{t}Xt?是一個(gè)具有零均值同方差的獨(dú)立分布序列:
Xt=μt,μt~N(0,σ2)X_{t}=\mu_{t}, \quad \mu_{t} \sim N(0, \sigma^2) Xt?=μt?,μt?~N(0,σ2)
則該序列常被稱為是一個(gè)白噪聲。
- 隨機(jī)游走
舉一個(gè)非平穩(wěn)時(shí)間序列的例子:隨機(jī)游走
有如下隨機(jī)過程生成:
Xt=Xt?1+μtX_{t}=X_{t-1}+\mu_{t} Xt?=Xt?1?+μt?
這里μt\mu_tμt?是一個(gè)白噪聲。
容易知道,該序列有相同的均值E(Xt)=E(Xt?1)E(X_{t})=E(X_{t-1})E(Xt?)=E(Xt?1?).為了檢驗(yàn)該序列是否具有相同的方差,可假設(shè)XtX_{t}Xt?的初值為X0X_{0}X0?,則易知:
X1=X0+μ1X2=X1+μ2=X0+μ1+μ2Xt=X0+μ1+μ2+...+μtX_{1}=X_{0}+\mu_{1} \\X_{2}=X_{1}+\mu_{2} = X_{0}+\mu_{1}+\mu_{2} \\X_{t}=X_{0}+\mu_{1}+\mu_{2}+...+\mu_{t} X1?=X0?+μ1?X2?=X1?+μ2?=X0?+μ1?+μ2?Xt?=X0?+μ1?+μ2?+...+μt?
設(shè)初值X0X_{0}X0?為常數(shù),μt\mu_{t}μt?是白噪聲,則Var(Xt)=tσ2Var(X_{t})=t\sigma^2Var(Xt?)=tσ2,即XtX_{t}Xt?的方差與時(shí)間ttt有關(guān)而非常數(shù),故他是非平穩(wěn)時(shí)間序列。
- 圖示
給出一個(gè)隨機(jī)時(shí)間序列,首先可通過該序列的時(shí)序圖來粗略地判斷它是否是平穩(wěn)的。平穩(wěn)時(shí)間序列在圖形上往往表現(xiàn)出種圍繞其均值不斷波動(dòng)的過程,而非平穩(wěn)時(shí)間序列往往表現(xiàn)出在不同的時(shí)間段具有不同的均值(如持續(xù)上升或持續(xù)下降)
時(shí)間序列的自相關(guān)性
自相關(guān)函數(shù)ACF
自相關(guān)函數(shù)是衡量序列yty_tyt?中任意兩個(gè)元素之間相關(guān)程度的度量。對于隨機(jī)過程{yty_tyt?},元素yty_tyt?與yt+ky_{t+k}yt+k?之間的自相關(guān)函數(shù)定義如下:
ρk=cov(yt,yt+k)var(yt)var(yt+k)\rho_k=\frac{cov(y_t,y_{t+k})}{\sqrt{var(y_t)var(y_{t+k})}} ρk?=var(yt?)var(yt+k?)?cov(yt?,yt+k?)?
自相關(guān)系數(shù)ρk\rho_kρk?的序列{ρk\rho_kρk?}(k=0,±1,±2,...k=0,\pm1, \pm2, ...k=0,±1,±2,...),稱為自相關(guān)函數(shù)(ACF)
當(dāng)yty_tyt?為平穩(wěn)隨機(jī)過程時(shí):
ρk=γkγ0=cov(yt,yt+k)var(yt)\rho_k=\frac{\gamma_k}{\gamma_0}=\frac{cov(y_t,y_{t+k})}{var(y_t)} ρk?=γ0?γk??=var(yt?)cov(yt?,yt+k?)?
由定義知,對任意隨機(jī)過程ρ0=1\rho_0=1ρ0?=1,由公式可知,ρk\rho_kρk?是一個(gè)無量綱量。γk\gamma_kγk?是時(shí)間序列滯后kkk期的協(xié)方差,γ0\gamma_0γ0?為方差,因此自相關(guān)函數(shù)是關(guān)于滯后期kkk的遞減函數(shù)。
在實(shí)際計(jì)算中,我們只能計(jì)算樣本自相關(guān)函數(shù),其樣本自相關(guān)函數(shù)定義為:
ρk^=∑i=1n?k(yt?y ̄)(yy+k?y ̄)∑i=1n(yt?y ̄)2k=1,2,3...\hat{\rho_k}=\frac{\sum_{i=1}^{n-k}(y_t- {\overline{y}})(y_{y+k}- {\overline{y}}) }{\sum_{i=1}^{n}(y_t - {\overline{y}})^2}\quad k=1,2,3... ρk?^?=∑i=1n?(yt??y?)2∑i=1n?k?(yt??y?)(yy+k??y?)?k=1,2,3...
- 圖示
隨著kkk的增加,樣本自相關(guān)函數(shù)下降且趨于0.但從下降速度來看,平穩(wěn)序列要比非平穩(wěn)序列快得多。
自相關(guān)性判別
- 圖示法
時(shí)間序列模型著重研究的是樣本關(guān)系,因此自相關(guān)函數(shù)在樣本中占有重要地位。
我們可以繪制滯后q期(Yt?qY_{t-q}Yt?q?)與當(dāng)期(YtY_{t}Yt?)的散點(diǎn)圖,來判斷是否存在自相關(guān)性。
也可以繪制acf圖來判斷時(shí)間序列數(shù)據(jù)的自相關(guān)性情況。值得注意的是,若存在yty_tyt?與yt+ky_{t+k}yt+k?之間的樣本自相關(guān)函數(shù)ρk^\hat{\rho_k}ρk?^?,滿足|ρk^\hat{\rho_k}ρk?^?|<1.96n\frac{1.96}{\sqrt{n}}n?1.96?,我們就有95%的把握判斷原時(shí)間序列不存在k階自相關(guān)。閾值1.96n\frac{1.96}{\sqrt{n}}n?1.96?,在acf圖中應(yīng)該會(huì)以虛線標(biāo)出。
- 假設(shè)檢驗(yàn)
①Box-Pierce檢驗(yàn)
伯克斯和皮爾斯提出的Q統(tǒng)計(jì)量,可以檢驗(yàn)時(shí)間序列的相關(guān)性,Q統(tǒng)計(jì)量定義為:
Q=n∑k=1mρk^2~χ2(m)Q=n{\sum_{k=1}^{m}\hat{\rho_k}^2}\sim\chi^2(m) Q=nk=1∑m?ρk?^?2~χ2(m)
其中,樣本量為你,m為滯后長度。在大樣本情況下,它近似服從自由度為m的χ2\chi^2χ2分布。若計(jì)算出的Q值大于一定顯著性水平下χ2\chi^2χ2分布的臨界值,則拒絕所有ρk\rho_kρk?同時(shí)為0的原假設(shè),則序列存在自相關(guān)性。
②Ljung-Box檢驗(yàn)
巴特雷特曾證明,如果時(shí)間序列由白噪聲過程生成,則對所有的k>0k>0k>0,樣本自相關(guān)系數(shù)近似地服從均值為0、方差為1/n的正態(tài)分布,其中n為樣本量。也可檢驗(yàn)對所有的k>0k>0k>0,自相關(guān)系數(shù)都為0的聯(lián)合假設(shè),這可通過如下QLBQ_{LB}QLB?統(tǒng)計(jì)量進(jìn)行:
QLB=n(n+2)∑k=1mρk^2n?k~χ2(m)Q_{LB}=n(n+2)\sum_{k=1}^{m}\frac{\hat{\rho_k}^2}{n-k}\sim\chi^2(m) QLB?=n(n+2)k=1∑m?n?kρk?^?2?~χ2(m)
該統(tǒng)計(jì)量近似地服從自由度為m的χ2\chi^2χ2分布.因此,如果計(jì)算的Q值大于顯著性水平α\alphaα的臨界值,則有1?α1-\alpha1?α的把握拒絕所有ρk(k>0)\rho_k(k>0)ρk?(k>0)同時(shí)為0的假設(shè)。
QLBQ_{LB}QLB?統(tǒng)計(jì)量比Q統(tǒng)計(jì)量有更好的小樣本性(也就是在統(tǒng)計(jì)意義上更有效),所以QLBQ_{LB}QLB?統(tǒng)計(jì)量常用來檢驗(yàn)小樣本的序列相關(guān)性。
R語言實(shí)現(xiàn)
繪制滯后一期與當(dāng)期散點(diǎn)圖:
library(TSA)y <- c(55,52,42,32,37,36,57,66,66,62,45,77,78,60,65)plot(y, x = zlag(y, 1), xlab = expression(Y[t-1]), ylab = expression(Y[t]), type = 'p', main = '滯后一期與當(dāng)期的散點(diǎn)圖')圖像:
由上圖可以看出yty_tyt?與yt?1y_{t-1}yt?1?貌似有那么點(diǎn)相關(guān)性。
繪制acf圖:
acf(y, main = '自相關(guān)圖')圖像:
可以看到一階自相關(guān)系數(shù)顯著,則可能存在一階自相關(guān)性。
計(jì)算自相關(guān)系數(shù):
acf(y)$ac控制臺(tái)輸出:
[,1][1,] 0.56735082[2,] 0.25659445[3,] 0.11299886[4,] -0.04724439[5,] 0.02717598[6,] -0.12748005[7,] -0.20916002[8,] -0.30212847[9,] -0.36191562 [10,] -0.22478145 [11,] -0.12675789Ljung-Box檢驗(yàn):
Box.test(y, type = 'Ljung-Box')控制臺(tái)輸出:
Box-Ljung testdata: y X-squared = 5.8629, df = 1, p-value = 0.01546可以看到p值小于0.05的顯著性水平,則拒絕原假設(shè),序列存在自相關(guān)性。
總結(jié)
以上是生活随笔為你收集整理的时间序列与R语言应用(part1)--时间序列基本概念的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 手机微信聊天记录可以恢复多久时间
- 下一篇: 时间序列与R语言应用(part3)--趋