时序分析:ARMA方法(平稳序列)
?? ? ?? 憔悴到了轉述中文綜述的時候了........
?????? 在統計學角度來看,時間序列分析是統計學中的一個重要分支, 是基于隨機過程理論和數理統計學的一種重要方法和應用研究領域.? 時間序列按其統計特性可分為平穩性序列和非平穩性序列. 目前應用最多的是Box一JenkinS 模型建模法, 它是由G.E.P.Box和英國統計學家G.M.JenkinS于1970年首次系統提出的.Box一JenkinS方法是一種較為完善的統計預測方法 , 他們的作用是為實際工作者提供了對時間序列進行分析、預測 , 以用對ARMA模型識別、估計和診斷的系統方法. 優點在于如果建立精確的模型后,并確定模型的系數之后,就可以根據有限的數據集對其發展進行預測 , 其中對于平穩性時間序列多采用ARMA模型 , 對于非平穩性時間序列模型常通過適當地變換 (如差分、取對數) 將它變為ARMA模型后再進行建模,這類模型Box一JenkinS稱為ARI琳(求和自回歸滑動平均模型) 。
?????? 參考鏈接:時序分析基礎
??????
一.? 平穩時間序列模型
?????? 數據的預處理:
????????????? 數據的預處理包括缺失值的補充、數據的平穩化及單位根檢驗.
平穩性
平穩性是時間序列分析中很重要的一個概念。一般的,我們認為一個時間序列是平穩的,如果它同時滿足一下兩個條件:
1)均值函數是一個常數函數。
2)自協方差函數只與時滯有關,與時間點無關。
以上面兩個時間序列為例。兩個序列均滿足條件1),因為標準正態分布白噪聲和其形成的隨機游走的均值函數都是值恒為0的常數函數。再來看條件2)。白噪聲的自協方差函數可以表述為:
γt,s={10(t=s)(t≠s)
可以看到只有在時滯為0時值為1,其它均為0,所以白噪聲是一個平穩序列。
而隨機游走我們上面分析過,其自協方差為:
γt,s=tσ2
很明顯其自協方差依賴于時間點,所以是一個非平穩序列。
后面可以看到,一般的時間序列分析往往針對平穩序列,對于非平穩序列會通過某些變換將其變為平穩的,例如,對于隨機游走來說,其一階差分序列是平穩的(顯然其一階差分是白噪聲)。
時序分析主要統計量
???? ? 注意時間序列中的每一個元素都是一個普通的隨機變量,如果忽略序列的時間性,那么我們面對的實際上是一個隨機變量集合,所以從這個角度來說時間序列的統計分析與普通統計分析沒有太大不同,相關的理論也是通用的。
?????? 對于隨機變量集合來說,要完整描述其統計特性需要處理其多元聯合分布,這是非常復雜的。所以實際我們往往做一些必要的簡化假設,避免處理復雜的多元聯合分布。
現假設我們有隨機時間序列
{Yt|t=0,±1,±2,?}下面先給出一些常用的統計量。后面會接著通過一些常見序列來舉例說明各統計量如何計算。
均值
均值函數被定義為關于自變量t的函數:
μt=E(Yt)t的均值函數值表示在t時刻隨機變量Yt的期望。
方差
與均值類似,方差是t時刻序列元素的方差:
σ2t=E((Yt?μt)2)自協方差
自協方差是一個二元函數,其自變量為兩個時間點,值是兩個時間點上序列值的協方差:
γt,s=Cov(Yt,Ys)=E((Yt?μt)(Ys?μs))當t=s時,自協方差就是t時刻的方差。
自相關系數
自相關系數是兩個時刻的值的相關系數:
ρt,s=γt,sγt,tγs,s?????√如果忽略元素來自時間序列這一事實,各統計量的意義實際上與普通的統計學中無異。因此這些統計量的一些性質也可以無縫推廣到時間序列分析。例如期望的線性性質等等。如果有需要可以自行復習一下這些統計量的相關計算性質。后面的推導會主要集中于這幾個統計量的計算。
常見的隨機時間序列
常見的隨機時間序列有:白噪音、布朗運動(隨機游走)、白噪聲
?????? 考慮一個時間序列,其中每一個元素為獨立同分布變量,且均值為0。這種時間序列叫做白噪聲。之所以叫這個名字,是因為對這種序列的頻域分析表明其中平等的包含了各個頻率,和物理中的白光類似。
??????
??????? 沒有模式即是白噪音的模式,所謂的白噪音即是隨機性的完全體現,即是不能從白噪音中發現任何模式。以下是一段代碼:
???? 其中共100個元素,每個元素都獨立服從標準正態分布N(0,1)。可以從圖中看出白噪聲基本是在均值附近較為平均的隨機震蕩。
由于每個元素服從N(0,1),所以均值μt=0,方差σ2t=1。又因為每個元素獨立,所以對于任何t≠s,γt,s=0,ρt,s=0。這些統計特征與對圖像的直觀觀察基本一致。
白噪聲的重要之處在于很多其它的重要時間序列都可以通過它構造出來,這一點下文會看到。我們一般用e表示白噪聲,將白噪聲序列寫作:
{e1,e2,…,et,…}布朗運動
下面考慮這樣一個時間序列,其在t時刻的值是前面白噪聲序列的前t個值之和,設{e1,e2,…,et,…}為標準正態分布產生的白噪聲,則:
Y1Y2Yt==?=?e1e1+e2e1+e2+?+et布朗運動的模式在于其位置是連續曲線,但曲線的處處不可微。
?????? Y = ts(rnorm(100, mean=0, sd=1));for (i in 2:length(Y)) {Y[i] = Y[i] + Y[i-1];}plot(Y, family="simhei", main="隨機游走", type="b", col="red");abline(h=0)可以看到隨機游走比白噪聲平滑很多,并且呈現出一些“趨勢性”的感覺。下面分析其相關統計特征。
均值:μt=E(e1+?+et)=E(e1)+?+E(et)=0
方差:σ2t=Var(e1+?+et)=Var(e1)+?+Var(et)=tσ2
對協方差的計算需要用到一個協方差性質:
Cov(∑i=1mciYi,∑j=1ndjYj)=∑i=1m∑j=1ncidjCov(Yi,Yj)
設t小于s,由于只有i=j時Cov(Yi,Yj)=σ2,所以:
自協方差:γt,s=tσ2
自相關系數:ρt,s=tσ2tsσ4√=ts√
從統計性質可以看到,隨機游走的“趨勢性”實際是個假象,因為其均值函數一直是白噪聲的均值,不存在偏離的期望。但是方差與時間呈線性增長并且趨向于無窮大,這意味著只要時間夠長,隨機游走的序列值可以偏離均值任意遠,但期望永遠在均值處。
物理與經濟學中的很多現象都被看做是隨機游走,例如分子的布朗運動,股票的價格走勢等等。
從協方差和相關系數看,如果起點t固定,則越接近的點相關性越大,例如ρ1,2=0.707,ρ1,3=0.577,ρ1,4=0.500。同時,起點不同,時滯相同自相關系數也不同,越往后同時滯自相關系數越大,例如ρ2,3=0.816,ρ3,4=0.866。
實際上從純數學角度可以將自相關系數看成一個二元函數,自變量是時間點t和時滯s-t。認識到這點很重要,因為它與時間序列分析中一個重要的概念——平穩性有著密切的關系。
二、AR、MA、ARMA模型
4、AR、MA、ARMA認是平穩時間序列最主要的參數模型. AR模型的正則方程是一組線形方程 ,而MA和ARMA模型是非線性方程.Word分解定理告訴我們任何有限方差的ARMA或MA平移過程可以用可能是無限階的AR模型表達;同樣,任何ARMA或AR模型可以用可能是無限階的撇模型表達.因此,如果在這三個模型中選一個與信號不匹配的模型,但只要模型的階足夠高,它能夠比較好地逼近被建模的隨機過程.三種模型中AR模型具有一系列好的性能,因此,是研究最多并獲得廣泛應用的一種模型。
三、模型用于預測
1.AR(n)模型預測
?????? 利用n之前的p個值對x(。)作預測,稱之為“前向預測”,記為:
????????
?????? 上標f表示前向預測(forwardprediction)·凡(,)表示在t時刻m步前向預測。利用自相關法、Burg算法、協方差、改進的協方差法等方法得到模型的參數后,就可以進行前向預測,利用預測值遞推可依次得到多步預測值
2.MA(q)、ARMA(p,q)模型預測
?????? MA(q)、ARMA(p,q)的外推預測一般都是將磁(q)、ARMA(p,q)模型轉換為相應的高階AR模型,再AR模型的預測公式進行外推預測.
3.預測誤差
????? 預測誤差公式為:
??????
?????? 線性最小方差預測的方差和預測步長l有關,而與預測的時間原點t無關.預測 步長l越大,預測誤差的方差也越大,因而預測的準確度就會降低.所以一般不能用AR、MA和ARMA模型作為長期預測模型.
四、非平穩時間序列模型
轉載于:https://www.cnblogs.com/wishchin/p/9200080.html
總結
以上是生活随笔為你收集整理的时序分析:ARMA方法(平稳序列)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 9个主流影视站手机仿站源码分享 v1.0
- 下一篇: 字母冒泡法排序c语言,C语言冒泡排序法的