arima模型 p q d 确定_时间序列分析第07讲(ARIMA模型,季节时间序列模型,均值的估计)...
3.3 廣義 ARMA 模型和 ARIMA 模型介紹
一、廣義 ARMA 模型
(1)定義
我們把 ARMA 模型中關于多項式 A(z),B(z) 的最小相位條件去掉(即允許有單位圓內的根),其余定義相同,得到的就是廣義 ARMA 模型。
(2)平穩解情況
如果 A(z) 在單位圓上有根,那么廣義 ARMA 模型沒有平穩解。
如果 A(z) 在單位圓上沒有根,則有
,使得 在圓環內解析,可以進行 Laurent 級數展開(在單位圓內按正常展開,單位圓外則用倒數來替代)得到
其中兩頭系數通項都負指數趨于 0,所以整體系數也負指數趨于 0,進而由唯一平穩解
但這個平穩解中,現在的觀察值會與將來的白噪聲有關,并沒有實際意義。此外,根據齊次差分方程理論,對于
其特征多項式有單位圓內的根,因此通解是趨于無窮的,所以這時廣義 ARMA 的其他解(通解)會趨于無窮,稱為爆炸模型。
二、求和 ARIMA(p,d,q) 模型
(1)定義
設 d 是一個正整數,如果
的 d 階差分是一個 ARMA(p,q) 序列(最后一個等號利用二項式定理展開),則稱
是一個求和 ARIMA(p,d,q) 序列。它滿足如下差分方程其中 A(z),B(z) 都按照 ARMA 模型的定義。
注:通常取 d=1,2,且該模型不存在平穩解
(2)非平穩解的討論
情形 d=1:即 ARIMA(p,1,q) 模型,這時
是 ARMA(p,q) 序列,給定初值可以得到可以通過產生 ARMA(p,q) ,進而利用該遞推式來得到 ARIMA(p,1,q) 序列。該模型也稱為單位根模型,當樣本數據不太大時,與平穩序列差異不大,不容易區分。
將單位根模型與如下趨勢模型進行對比:
其中 Y 是 ARMA(p,q) 序列。
單位根模型與趨勢模型得到的都是非平穩序列,單位根模型通過一次差分后,序列變為平穩;趨勢模型通過減去趨勢項,序列也變為平穩。但單位根模型減去趨勢項,仍非平穩。
情形 d=2:即 ARIMA(p,2,q) 模型,這時
是一個 ARMA(p,q) 序列。由此可以得到遞推關系如下
兩邊對 t 求和(從 1 到 n1)得到
到這里就得到了類似 ARIMA(p,1,q) 模型,移項得到
再對 n1 求和(從 1 到 t )得到
從這可以看出有一部分線性趨勢,但如果減掉,剩下的還是一個類似 ARIMA(p,1,q) 序列,仍然是非平穩的。其通解可以寫為如下形式
類似地可以推廣到 ARIMA(p,d,q) 情形,其通解為
形式上看,它的通解為 ARMA 序列的 d 重求和,加上一個多項式的趨勢。
(3)幾種特殊情形
a. ARI(1,1) 模型(即 ARIMA(1,1,0)),差分后得到 AR(1) 序列
或
其中 a 的模小于 1,看上去是 AR(2) 但并不是,因為根在單位圓內了!
將其非平穩解表示成 wold 系數的形式
將 wold 系數形式代回原模型,可以得到 wold 系數的遞推關系(此處不要求,步驟略寫,但思想需要掌握)
結合初值得到
可以看出 wold 系數并不收斂于 0,所以 X_t 是非平穩的。
b. IMA(1,1) 模型(即 ARIMA(0,1,1))--商業和經濟中常用
模型為
設序列首次觀測的時間為 -m ,則在此之前( t<-m )沒有觀測值,都記為 0.
那么由模型不斷遞推得到
這時一個 MA(t+m+1) 模型。
其方差為系數的平方和
對于較大的 m 和中等大小的 k,相關系數近似為
其中協方差與 X_t 的方差只在 ε_t 的系數部分有差別。
可見,當 t 增大時,方差會無限增大。并且對于多個滯后期數 k,
和 高度正相關。這種周期性符合現實經濟和商業的特性。三、季節 ARMA 模型
(1)季節 MA 模型
例如我們拿到了 2000-2020 年每個月份的數據,那么我們將數據按月份分為 12 組,對每組的數據用 MA 模型來建模,就得到季節 MA 模型。如果數據是按季度分的,也是同理。
此時模型為
計算自協方差函數如下
序列是平穩的,并且僅在滯后 12 處才有非零的自相關性。這樣得到的每一個月份都是同一個 MA 模型。
現在我們考察周期為 s 的 MA(Q) 模型:
從形式上看,季節 MA(Q) 模型也就是 MA(Qs) ,只不過其中很多系數都是 0。
同樣地,它也是平穩序列,并且自相關系數只在 s, 2s, 3s, ... , Qs 處非零,具體表達式如下
分母是系數的平方和,分子是系數錯一位的乘積和。
(2)季節 AR 模型
類似地,季節 AR(1) 模型為
因為根在單位圓外,所以將來的白噪聲和過去的觀察值是不相關的。兩邊同乘
,然后取數學期望得到遞推可得
其中第二行利用
利用 AR 模型的方法可以得到季節 AR(1) 模型的平穩解為
同樣可以推廣到季節 AR(p) 模型
特征多項式滿足
(3)季節 ARMA 模型
定義周期為 s 的季節
模型為這里的 p,q 為
的階數,P,Q 為 的階數。一般 p,q 不超過 3。問:這里為什么要多出
呢?答:如果沒有
,那么某一季節的數據只與該季節中不同年份的數據有關,而與其它季節的數據無關,與實際不符。如果按之前(1)(2)來建立模型
這時白噪聲不應該是白噪聲,而應該是一個 ARMA(p,q) 序列,這就得到了上面的定義。
例:考慮季節 ARMA 模型
將后移算子展開得到
計算自協方差和自相關系數如下
一個小發現:
的形式與模型很像,把所有的 B 換成平方,減號換加號。雖然我沒有證明,但直覺上這是成立的,或者二者之間至少有某種關系。先挖個坑,之后填 。其自協方差函數不會很快趨于0,而是具有一定的周期性。
例:考察模型
兩邊同乘
并取數學期望得到經常用到:將來的白噪聲和現在的觀測值不相關。
由第二行同除
可得由第二行取 k = 11,并結合第一行可以解得
,然后再利用第二行得到對于其余的 k(例如 2),第二行分別用 2 和 10 來代,解得兩個自協方差函數都是 0,進而自相關函數都是 0.
(4)非平穩季節 ARIMA 模型
如果
是周期為 s 的季節 模型,那么稱 Xt 為季節周期 s,非季節階數為 p,d,q ,季節階數為 P,D,Q 的季節 ARIMA 模型,或稱周期為 s的 模型。說明:
為某個 d 階多項式作用后移算子,表示橫向趨勢(即不同季節之間), 為某個 D 階多項式作用后移算子的 s 次方,表示縱向趨勢(同一季節不同年份之間)。實際問題中 d 和 D 都很小,一般 D=0 或 1,如果取更大,那么上升速度就過快了,不是爆發的階段一般不這么取。
回顧建模步驟:
考察如下的周期 12 , N 年的數據
對第 j 列數據,將其中心化(減去均值,記為 Z )后,可以擬合一個 ARMA(p,q) 序列。
之前提到,如果這里的白噪聲真的就是白噪聲,那么不同季節之間不相關,顯然不合理。
所以假設這時的
也是一個 ARMA 序列,建立一個較低階的 ARMA(p0,q0) 模型。進而得到季節 ARMA 模型
但這樣的模型沒有考慮隨年份,隨季節的遞增趨勢,所以上面的 Z 實際上應該要經過差分才能得到,而不僅僅是中心化。
由差分后得到的 Z 結合之前的季節 ARMA 模型,可以得到關于 Y 的季節 ARIMA 模型
第四章 均值和自協方差函數的估計
4.1 均值的估計
通過之前對不同模型的介紹,我們了解到 AR,MA,ARMA 模型的參數都可以由其自協方差函數唯一確定。因此如何由樣本來估計自協方差函數是關鍵的。
估計量是自然的:用樣本均值估計總體均值,樣本自協方差函數估計總體自協方差函數。
但這里需要考慮幾個問題:相合性、漸近分布、收斂速度。
(一)相合性
定理:平穩序列的自協方差函數收斂到0,那么樣本均值是總體均值的相合估計。
根據定義,求樣本均值與總體均值的均方誤差
第二個等號把求和平方寫成雙重求和,然后得到自協方差函數(第三個等號),再做求和指標的變換。第四個等號:類似二重積分的交換次序,先考慮 m 的范圍,容易得到 1-N 到 N-1 。然后利用 m 原本的范圍 1-j 到 N-j 可以得到 j 的范圍是 1-m 到 N-m ,但 j 一開始已經固定在 1 到 N 中,取交集就得到這個結果。第五個等號通過對 m 的正負討論來計數。最后一步,利用數學分析中“數列平均的極限等于通項的極限”的結論。
進而利用切比雪夫不等式
得到樣本均值的相合性。
此外,如果平穩序列是嚴平穩且遍歷的,那么樣本均值是強相合的。
回顧一下,嚴平穩遍歷序列有強大數律:
(二)中心極限定理
我們知道如果時間序列數據中每個樣本點是獨立同分布的,那么
有了漸近分布,計算參數的置信區間就容易了。下面討論一般的平穩列的中心極限定理。
定理 對于線性平穩列,如果白噪聲時同分布的
其中白噪聲的系數平方可和(絕對可和當然更加成立),則只要平穩列的譜密度
在 0 處連續并且
,那么有如下漸近分布:其中漸近方差的計算如下(與之前相合性證明的過程一樣):
然后利用自協方差函數與譜密度的關系,可以得到定理中的
,此外也可以用平穩序列的自協方差函數公式來得到,具體步驟如下注意:如果考試讓證明某個平穩列的中心極限定理,不能直接用這個定理來得到。過程應該是:把 X1+X2+...+Xt 用白噪聲來表示,利用白噪聲的獨立性,由不同分布的中心極限定理來得到漸近正態性。
總結
以上是生活随笔為你收集整理的arima模型 p q d 确定_时间序列分析第07讲(ARIMA模型,季节时间序列模型,均值的估计)...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python不支持_不支持的操作:不可写
- 下一篇: checkbox控件的checked属性