【时间序列分析】01.时间序列与平稳序列
文章目錄
- 一、時間序列與平穩序列
- 1.時間序列的概念
- 2.重要的時間序列——平穩序列
- 3.特殊的平穩序列——白噪聲
- 4.多平穩序列的相互關系
- 回顧總結
一、時間序列與平穩序列
1.時間序列的概念
時間序列,就是按照時間次序排列的隨機變量列,其最重要的特征就是具有時間關系,即處于不同時間的隨機變量可能具有一定的聯系。生活中有許多時間序列,如每個月的平均氣溫、股市每天的收盤價等等,都是時間序列。
任何時間序列,經過合理的變換后都可以看作由三個部分疊加而成:趨勢項,周期項和隨機噪聲項。趨勢項大體刻畫了時間序列的變化趨勢,是一個固定的、可以預測的項;周期項是具有一定周期的時間序列,比如一年四季每個季節有各自的特征,就可以用周期項來刻畫;隨機噪聲則是隨機干擾,一般被視為獨立的零均值序列。
以上關系概括說來,就是
Xt=Tt+St+Rt.X_t=T_t+S_t+R_t. Xt?=Tt?+St?+Rt?.
在實際生活中,時間不能倒流,所以時間序列往往只能夠發生一次,即獲得一次觀測。X1,X2,?X_1,X_2,\cdotsX1?,X2?,?的一組實際數值x1,x2,?x_1,x_2,\cdotsx1?,x2?,?是時間序列的一次實現或一條軌道。
在獲得觀測值后,要對時間序列進行以上的分解,才能夠獲得具有實際意義的分布。有一些常用的分解方式,如分段趨勢分解,回歸直線法,二次曲線回歸法,逐步平均法等等。
隨機過程中將時間指標分成連續集與離散集兩種,即ttt的取值可以是連續的R,R+\R,\R_+R,R+?或離散的Z,Z+\Z,\Z_+Z,Z+?,我們將重點放在離散時間序列上。
2.重要的時間序列——平穩序列
時間序列的趨勢項和季節項往往可以用非隨機的函數進行刻畫,剩下的隨機噪聲項,往往會具有某種平穩波動性,即在某條直線上下跳躍。平穩序列是用來描述某一種具有平穩波動性序列的序列,其定義如下。
如果時間序列{Xt}\{X_t\}{Xt?}滿足:
就稱{Xt}\{X_t\}{Xt?}是平穩時間序列,稱{γt}\{\gamma_t\}{γt?}為{Xt}\{X_t\}{Xt?}的自協方差函數。
從平穩序列的定義可以看出,它的平穩表現在兩個方面,一是均值、方差的平穩性,即均值、方差與時間無關;二是相關性的平穩性,即序列中的任意兩個隨機變量自協方差函數,只與時間差有關,而與它們的絕對位置無關。
需要注意,自協方差函數是包含分布的方差的,因為DXt=γ0{\rm D}X_t=\gamma_0DXt?=γ0?。這也說明了方差與時間無關,因為對任何XtX_tXt?,其方差都是γ0\gamma_0γ0?,是一個常數。如果γ0=0\gamma_0=0γ0?=0,那么隨機變量就是一個常數,沒有討論的必要,因此我們總假定γ0>0\gamma_0>0γ0?>0。
從平穩序列的定義來看,它最重要的元素無疑是自協方差函數,這刻畫了序列內部的關系。首先,很顯然對于任何實時間序列,其自協方差序列都是實數列,除此外自協方差函數有以下三條重要性質:
1、對稱性,即γk=γ?k\gamma_k=\gamma_{-k}γk?=γ?k?對所有k∈Zk\in\Zk∈Z成立。
2、非負定性,即對任何n∈Nn\in\Nn∈N,nnn階自協方差矩陣
Γn=[γ0γ1?γn?1γ1γ0?γn?2???γn?1γn?2?γ0]\Gamma_n=\begin{bmatrix} \gamma_0&\gamma_1&\cdots&\gamma_{n-1}\\ \gamma_1&\gamma_0&\cdots&\gamma_{n-2}\\ \vdots&\vdots&&\vdots\\ \gamma_{n-1}&\gamma_{n-2}&\cdots&\gamma_0 \end{bmatrix} Γn?=??????γ0?γ1??γn?1??γ1?γ0??γn?2??????γn?1?γn?2??γ0????????
總是非負定的。
3、有界性,即對任何k∈Zk\in\Zk∈Z,有∣γk∣≤γ0|\gamma_k|\le \gamma_0∣γk?∣≤γ0?。
同時滿足以上三條性質的實數列稱為非負定序列,平穩序列的自協方差函數就是非負定序列,并且可以證明,每個非負定序列都可以是一個平穩序列的自協方差函數。這里建立了非負定序列與平穩序列的對應性。
接下來對平穩序列的這三條性質進行證明。對稱性最顯然,由定義就可以直接看出,即
γk=Cov(Xt,Xt+k)=Cov(Xt+k,Xt+k?k)=γ?k.\gamma_k={\rm Cov}(X_{t},X_{t+k})={\rm Cov}(X_{t+k},X_{t+k-k})=\gamma_{-k}. γk?=Cov(Xt?,Xt+k?)=Cov(Xt+k?,Xt+k?k?)=γ?k?.
非負定性,即自協方差矩陣是非負定矩陣,對于任何一個二次型要證明其非負,就任取一個常數向量,計算
an′Γnan=∑j=1n∑k=1najakγj?k=∑j=1n∑k=1nakajCov(Xk,Xj)=D(∑j=1najXj)≥0.\begin{aligned} \boldsymbol a'_n\Gamma_n\boldsymbol a_n=&\sum_{j=1}^n\sum_{k=1}^na_ja_k\gamma_{j-k}\\ =&\sum_{j=1}^n\sum_{k=1}^na_ka_j{\rm Cov}(X_k,X_{j})\\ =&{\rm D}(\sum_{j=1}^n a_jX_j)\ge0. \end{aligned} an′?Γn?an?===?j=1∑n?k=1∑n?aj?ak?γj?k?j=1∑n?k=1∑n?ak?aj?Cov(Xk?,Xj?)D(j=1∑n?aj?Xj?)≥0.?
這個證明過程中,需要牢記的是二次型的寫法,即將二次型寫成一個雙重求和的結果,每一項是bjbkb_jb_kbj?bk?與二次型矩陣的第(j,k)(j,k)(j,k)項乘積;并且將雙重求和轉化成一個單次求和的函數,這個思想也很重要。
有界性,用到柯西不等式,將隨機變量中心化,即Yt=Xt?μY_t=X_t-\muYt?=Xt??μ,那么DYt=DXt=γ0{\rm D}Y_t={\rm D}X_t=\gamma_0DYt?=DXt?=γ0?,Cov(Xt,Xt+k)=Cov(Yt,Yt+k)=γk{\rm Cov}(X_t,X_{t+k})={\rm Cov}(Y_t,Y_{t+k})=\gamma_kCov(Xt?,Xt+k?)=Cov(Yt?,Yt+k?)=γk?,就有∣γk∣=∣E(YtYt+k)∣≤EYt2EYt+k2=γ0|\gamma_k|=|{\rm E}(Y_tY_{t+k})|\le \sqrt{{\rm E}Y_t^2{\rm E}Y_{t+k}^2}=\gamma_0∣γk?∣=∣E(Yt?Yt+k?)∣≤EYt2?EYt+k2??=γ0?,這里小于等于號就是柯西不等式的結果。
由有界性可以知道?1≤γk/γ0≤1-1\le \gamma_k/\gamma_0\le 1?1≤γk?/γ0?≤1,與相關系數有很大的相似之處,所以我們將γk/γ0\gamma_k/\gamma_0γk?/γ0?定義為平穩序列的自相關系數,也就是自協方差函數的歸一化。在某些情況下,自相關函數甚至比自協方差函數還要重要。
我們再將目光投射到三條性質中,最不平凡的那條,即非負定性上。既然我們知道?an\forall \boldsymbol a_n?an?,有an′Γnan≥0\boldsymbol a_n'\Gamma_n\boldsymbol a_n\ge 0an′?Γn?an?≥0,那么作為臨界情況的等號成立時意味著什么呢?顯然等號很難對于所有an\boldsymbol a_nan?都成立(除非Γn=O\Gamma_n=OΓn?=O,但這是沒有意義的),所以我們討論對某個特定的an\boldsymbol a_nan?等號成立的情況。由于
an′Γnan=D(∑j=1najXj),\boldsymbol a_n'\Gamma_n\boldsymbol a_n={\rm D}(\sum_{j=1}^n a_jX_j), an′?Γn?an?=D(j=1∑n?aj?Xj?),
我們不妨定義X=(X1,?,Xn)′\boldsymbol X=(X_1,\cdots,X_n)'X=(X1?,?,Xn?)′,那么an′Γnan=D(a′X)=0\boldsymbol a_n'\Gamma_n\boldsymbol a_n={\rm D}(\boldsymbol a'\boldsymbol X)=0an′?Γn?an?=D(a′X)=0,也就說明a′X\boldsymbol a'\boldsymbol Xa′X是常數,結合其均值來看應該有a′X=μa′1n\boldsymbol a'X=\mu\boldsymbol a'\boldsymbol 1_na′X=μa′1n?(1n\boldsymbol 1_n1n?指全是1的列向量)。由于我們規定an≠0\boldsymbol a_n\ne0an??=0,那么一定存在一個下標最大的分量ak≠0a_k\ne 0ak??=0,使得XkX_kXk?可以被X1,?,Xk?1X_1,\cdots,X_{k-1}X1?,?,Xk?1?線性表示。這時,我們稱X1,?,XnX_1,\cdots,X_nX1?,?,Xn?是線性相關的。
并且進一步看,由于自協方差函數與序列位置無關,即
an′Γnan=∑j=1n∑k=1najakCov(Xt+j,Xt+k)=D(∑j=1najXt+j)=0,\boldsymbol a_n'\Gamma_n\boldsymbol a_n=\sum_{j=1}^n\sum_{k=1}^na_ja_k{\rm Cov}(X_{t+j},X_{t+k})={\rm D}(\sum_{j=1}^n a_jX_{t+j})=0, an′?Γn?an?=j=1∑n?k=1∑n?aj?ak?Cov(Xt+j?,Xt+k?)=D(j=1∑n?aj?Xt+j?)=0,
所以對任何一組的連續的(Xt+1,?,Xt+n)(X_{t+1},\cdots,X_{t+n})(Xt+1?,?,Xt+n?),都有Xt+kX_{t+k}Xt+k?可以被Xt+1,?,Xt+k?1X_{t+1},\cdots,X_{t+k-1}Xt+1?,?,Xt+k?1?線性表示,并且表示系數是相同的。這一性質,表明對于退化的Γn\Gamma_nΓn?,任何Xt,t≥nX_{t},t\ge nXt?,t≥n都可以被X0,?,Xn?1X_0,\cdots,X_{n-1}X0?,?,Xn?1?線性表示,這進一步說明了對于任意的nnn個XtX_tXt?,它們一定是線性相關的,不管是不是連續增長的時間指標ttt。
事實上,用多元統計的觀點看,設X=(Xt+1,Xt+2,?,Xt+n)\boldsymbol X=(X_{t+1},X_{t+2},\cdots,X_{t+n})X=(Xt+1?,Xt+2?,?,Xt+n?),那么Γn=D(X)\Gamma_n={\rm D}(\boldsymbol X)Γn?=D(X),即隨機向量的協方差矩陣,那么自然有
E(AX+B)=AX+B,D(AX+B)=AD(X)A′=AΓnA′.{\rm E}(A\boldsymbol X+B)=A\boldsymbol X+B,\quad {\rm D}(A\boldsymbol X+B)=A{\rm D}(\boldsymbol X)A'=A\Gamma_nA'. E(AX+B)=AX+B,D(AX+B)=AD(X)A′=AΓn?A′.
當A=an′,B=cA=\boldsymbol a'_n,B=cA=an′?,B=c的時候,顯然有D(an′X+c)=an′Γnan≥0D(\boldsymbol a_n'\boldsymbol X+c)=\boldsymbol a_n'\Gamma_n\boldsymbol a_n\ge 0D(an′?X+c)=an′?Γn?an?≥0。
需要注意的是,平穩序列并不一定是平穩但散亂的,也可以具有很強的周期性,其典型例子就是調和平穩序列Xt=bcos?(at+U),U~U(?π,π)X_t=b\cos(at+U),U\sim U(-\pi,\pi)Xt?=bcos(at+U),U~U(?π,π),它的自協方差函數是12b2cos?((t?s)a)\frac 12b^2\cos ((t-s)a)21?b2cos((t?s)a),具有很強的周期性,所以觀測樣本也會具有周期性。
3.特殊的平穩序列——白噪聲
白噪聲是一種最為簡單,但也頗具地位的平穩序列,其定義如下。
設{εt}\{\varepsilon_t\}{εt?}是一個平穩序列,如果對任何s,t∈Ns,t\in\Ns,t∈N,都有
Eεt=μ,Dεt=σ2,Cov(εt,εs)=0,t≠s.{\rm E}\varepsilon_t=\mu,\quad {\rm D}\varepsilon_t=\sigma^2,\\ \quad {\rm Cov}(\varepsilon_t,\varepsilon_s)=0,\quad t\ne s. Eεt?=μ,Dεt?=σ2,Cov(εt?,εs?)=0,t?=s.
就稱{εt}\{\varepsilon_t\}{εt?}是一個白噪聲,記作WN(μ,σ2){\rm WN}(\mu,\sigma^2)WN(μ,σ2)。
關于其方差和協方差的另一種寫法是
Cov(εt,εs)={σ2,t=s0,t≠s=σ2δt?s.{\rm Cov}(\varepsilon_t,\varepsilon_s)=\left\{ \begin{array}l \sigma^2,&t=s\\ 0,&t\ne s \end{array}=\sigma^2\delta_{t-s}. \right. Cov(εt?,εs?)={σ2,0,?t=st?=s?=σ2δt?s?.
這里δk\delta_kδk?是克羅內克(Kronecker)函數,當k=0k=0k=0時δk=1\delta_k=1δk?=1,否則δk=0\delta_k=0δk?=0。
白噪聲又可以細分為以下幾類:
- 當{εt}\{\varepsilon_t\}{εt?}是獨立序列時,稱為獨立白噪聲(定義只保證了不相關);
- 當μ=0\mu=0μ=0時,稱為零均值白噪聲;
- 當μ=0,σ2=1\mu=0,\sigma^2=1μ=0,σ2=1時,稱為標準白噪聲;
- 當{εt}\{\varepsilon_t\}{εt?}服從正態分布且是獨立序列時,稱為正態白噪聲。
4.多平穩序列的相互關系
多平穩序列的相互關系,指的是對于兩個平穩序列{Xt}\{X_t\}{Xt?}和{Yt}\{Y_t\}{Yt?},它們之間具有的相互性質。具體可以細分為正交平穩序列和不相關平穩序列,其定義如下:
正交的:如果?s,t∈Z\forall s,t\in\Z?s,t∈Z,都有E(XtYs)=0{\rm E}(X_tY_s)=0E(Xt?Ys?)=0,就稱{Xt},{Yt}\{X_t\},\{Y_t\}{Xt?},{Yt?}是正交的。
不相關的:如果?s,t∈Z\forall s,t\in\Z?s,t∈Z,都有E(XtYs)=EXtEYs{\rm E}(X_tY_s)={\rm E}X_t{\rm E}Y_sE(Xt?Ys?)=EXt?EYs?,就稱{Xt},{Ys}\{X_t\},\{Y_s\}{Xt?},{Ys?}是不相關的。
這兩個定義很好從字面意義上理解。正交是垂直的推廣,在線性代數中兩個向量a,ba,ba,b正交被定義為其內積?a,b?=0\langle a,b\rangle=0?a,b?=0,在平穩序列中,就是乘積的期望為0;不相關就是二者不對對方產生影響,所以乘起來求期望與分開求期望相乘得到的結果理應是一樣的。如果EXtEYs=0{\rm E}X_t{\rm E}Y_s=0EXt?EYs?=0,那么正交序列和不相關序列本身等價,也就是說,對于零均值平穩序列,其正交性和不相關性是等價的。
為什么要討論這兩種特殊的關系呢?我們以后可能會對平穩序列進行求和,即Zt=Xt+YtZ_t=X_t+Y_tZt?=Xt?+Yt?,如果{Zt}\{Z_t\}{Zt?}本身也能夠是平穩序列那再好不過了。幸運的是,{Xt},{Yt}\{X_t\},\{Y_t\}{Xt?},{Yt?}是正交、不相關序列時,都能讓{Zt}\{Z_t\}{Zt?}是平穩序列。
要證明{Zt}\{Z_t\}{Zt?}是平穩序列,就要證明其二階矩有限、期望平穩、自協方差函數僅與時間差有關。期望平穩是顯然的,有μZ=μX+μY\mu_Z=\mu_X+\mu_YμZ?=μX?+μY?;二階矩有限也是顯然的,有
EZt2=E(Xt+Yt)2≤2EXt2+2EYt2<∞.{\rm E}Z_t^2={\rm E}(X_t+Y_t)^2\le 2{\rm E}X_t^2+2{\rm E}Y_t^2<\infty. EZt2?=E(Xt?+Yt?)2≤2EXt2?+2EYt2?<∞.
接下來對正交、不相關序列,分別求{Zt}\{Z_t\}{Zt?}的自協方差函數。首先是正交的情況,有
Cov(Zt,Zs)=Cov(Xt,Xs)+Cov(Xt,Ys)+Cov(Yt,Xs)+Cov(Yt,Ys)=γX(t?s)+γY(t?s)+E(XsYt)?EXsEYt+E(XtYs)?EXtEYs=γX(t?s)+γY(t?s)?2μXμY;\begin{aligned} {\rm Cov}(Z_{t},Z_s)=&{\rm Cov}(X_t,X_s)+{\rm Cov}(X_t,Y_s)+{\rm Cov}(Y_t,X_s)+{\rm Cov}(Y_t,Y_s)\\ =&\gamma_X(t-s)+\gamma_Y(t-s)+{\rm E}(X_sY_t)-{\rm E}X_s{\rm E}Y_t+{\rm E}(X_tY_s)-{\rm E}X_t{\rm E}Y_s\\ =&\gamma_X(t-s)+\gamma_Y(t-s)-2\mu_X\mu_Y; \end{aligned} Cov(Zt?,Zs?)===?Cov(Xt?,Xs?)+Cov(Xt?,Ys?)+Cov(Yt?,Xs?)+Cov(Yt?,Ys?)γX?(t?s)+γY?(t?s)+E(Xs?Yt?)?EXs?EYt?+E(Xt?Ys?)?EXt?EYs?γX?(t?s)+γY?(t?s)?2μX?μY?;?
然后是不相關的情況,立馬得到Cov(Zt,Zs)=γX(t?s)+γY(t?s){\rm Cov}(Z_t,Z_s)=\gamma_X(t-s)+\gamma_Y(t-s)Cov(Zt?,Zs?)=γX?(t?s)+γY?(t?s)。這兩個數都是t?st-st?s的函數,這就證明了對正交、不相關平穩序列,其和仍然是平穩序列。
加和的自協方差函數不方便記憶,可以記以下的簡化結論:對于零均值的正交平穩序列{Xt},{Yt}\{X_t\},\{Y_t\}{Xt?},{Yt?},他們的和{Zt},Zt=Xt+Yt\{Z_t\},Z_t=X_t+Y_t{Zt?},Zt?=Xt?+Yt?仍是平穩序列,且μZ=μX+μY,γZ(k)=γX(k)+γY(k)\mu_Z=\mu_X+\mu_Y,\gamma_Z(k)=\gamma_X(k)+\gamma_Y(k)μZ?=μX?+μY?,γZ?(k)=γX?(k)+γY?(k)。
回顧總結
總結
以上是生活随笔為你收集整理的【时间序列分析】01.时间序列与平稳序列的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: .NET 常用ORM之SubSonic
- 下一篇: (HDRP)全局光照技术初探(一)-光照