日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

时间序列的截尾和拖尾_R语言:时间序列(一)

發布時間:2023/12/2 编程问答 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 时间序列的截尾和拖尾_R语言:时间序列(一) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

01 解決什么問題

在社會活動中經常可見按照時間順序記錄下來的隨機事件觀察值,例如每年死亡人數序列,每年糖尿病發病人數序列,醫院門診每日診治病例數序列。這類數據的特性是相鄰時間點的觀察值之間具有明顯的相關性,這一特性不同于獨立隨機觀察資料,因而不能用通常以獨立隨機觀察為假定條件的統計方法分析,而要采用時間序列分析方法分析。

先來看一個時間序列的例子。收集了某市2007年1月1日至2009年12月31日的大氣中顆粒物PM的每日測定值。從圖可見,該市空氣中顆粒物PM10含量的日平均值變化特點是:年初和年末的平均濃度較高,夏秋季的平均濃度較低。

02 時間序列資料的影響因素

一個時間序列資料通常可以分解為確定性部分和隨機部分。確定性部分又可進一步分解為趨勢部分、循環或周期部分以及季節變動部分。

將上圖的時間序列資料分解,形成如下圖,可看到:

第一 趨勢部分:反應長期的變化趨勢,如上升或下降或平穩。下圖的看來,雖然有起伏,但總的趨勢是平穩的。

第二 循環或周期部分:表現為圍繞總體趨勢水平出現有節奏的周期變動,如經濟發展中出現時快時慢的周期變化。

第三 季節變動,指在一個日歷年份內因季節氣候變化的影響發生的變動,每年都重復,一般受氣候或人們生活方式影響的結果,下圖三中表現的每年都呈現一個U型曲線,是一種明顯的季節變動。當然,有的時間序列呈現周期波動,如門診量由于受工作日影響而重復出現星期內波動。

第四 不規則變動,它是除確定性部分之外的隨機波動。如下圖四。

03 幾種時間序列

社會生活中時間序列一般包含上述幾個組分,如果只有不規則變動組成,不包含其他三種成分,那么就是上圖1序列,稱為平穩序列,數據圍繞一個值上下波動,由于不規則變化,則無法預測下個時間是往上還是往下。如果包含一個向上的長期趨勢,如圖2,則為一個趨勢序列。如果在平穩時間序列上加一個季節性變化,則如圖3所示,稱之為季節型序列。季節和趨勢組合就是圖四的形式,有一個向上的趨勢,同時還有周期性變化。一般情況下不規則變化都是存在的。

04 幾個重要的概念

1.自相關函數

在時間序列中,其前期狀態對后續狀態往往有影響,這種影響越大,相關性就越強,這種相關性就叫自相關。它有兩個指標:自相關函數和偏自相關函數,它倆的作用是啥呢?自相關函數用acf表示,它可以檢驗時間序列在時間點t與滯后h期的時間點t-h的觀察值之間是否存在顯著自相關性。通過acf()函數計算自相關函數圖:

該圖的橫坐標Lag表示滯后期數h,縱坐標ACF給出每一滯后期h的自相關函數值。兩條平行的橫虛線分別代表95%可信區間的臨界水平,凡是超過虛線的豎線條都具有統計學意義,原假設是自相關函數等于0,如果落在兩虛線之間,則表示無統計學意義。

從圖可以看出,滯后0階(h=0)恒等于1,這是PM10的自身相關性。將它的每一滯后期的自相關函數值打印出來可看到,前20期豎線都在虛線上面,函數值緩慢降低,各期都有統計學意義和自相關性,屬于拖尾狀態。

2.偏相關性函數

偏自相關函數又稱PACF,它不同于自相關函數,它消除了其他觀察值的影響后yt和y(t+h)單純的相關關系。通過pacf()函數可計算得到:可看到滯后一期的相關函數值為0.72,具有高度統計學意義,之后下降很快,后面偏自相關函數在顯著水平波動,處截尾狀態。

3.時間序列的平穩性

實際工作中,只要滿足①均值E(Yt)=u是與時間無關的常數;②方差是與時間無關的常數,Var(Yt)=γ。③協方差是只與時間間隔k有關,而與時間t無關的常數,Cov(Yt,Yt+k)=γ(0,k)就可以認為是平穩性序列。

4.平穩性檢驗

由于對時間序列資料分析的一個重要假設條件就是平穩性,因此很有必要先判斷是否符合平穩性。

①直接觀察ACF圖,平穩的序列的自相關圖和偏相關圖不是拖尾就是截尾。截尾就是在某階之后系數都為0,看上面偏相關的圖,當階數為1的時候,系數值還是很大是0.72 二階長的時候突然就變成了 0.050. 后面的值都很小,認為是趨于0,這種狀況就是截尾。再就是拖尾,拖尾就是有一個衰減的趨勢,但是不都為 0,看上面自相關圖.如果自相關圖既不是拖尾也不是截尾,這里我們用文章開頭的案例,計算滯后400階的自相關圖,如下圖。下圖的自相關是一個三角對稱的形式,這種趨勢是單調趨勢的典型圖形。這個案例是一個具有季節變動的不平穩時間序列。

①常用一個是tseries包中adf.test()函數做單位根檢驗,p>0.05表示是不能拒絕原假設,不平穩時間序列。檢驗文章開頭的案例,P>0.05,不能拒絕原假設,表明該序列為非平穩時間序列。

5.非平穩性怎么辦呢?

對于非平穩序列,如有具有某種趨勢,則可以采用差分的方法消除這種趨勢,從而達到平穩性。也可以采用對數的方式消除這種趨勢,也可以聯合數學變換和差分的方法消除,后面會詳細介紹差分。

6.幾種基本的平穩時間序列模型
1.自回歸模型(AR)

通常用AR(p)表示p階自回歸模型,用時間序列的一系列過去值和當前值建立自回歸的關系。

2.移動平均模型(MA)

一個q階的移動平均模型用MA(q)表示當前觀察值是當前以及向后過去q階白噪聲的線性組合。

3.自回歸移動平均(ARMA)

實際工作中大部分都是AR和MA的組合,這種模型表示為ARMA(p,q),前面介紹的acf和pacf可以幫助我們識別模型及其階數。

05 總結

本文作為時間序列的第一章,主要介紹時間序列中常用基本概念和術語,以方便對后面的建模深入理解。之后會針對不同的時間序列資料,討論使用的不同的模型。

06 更多閱讀

文章在公粽號:易學統計

文章里的干貨更多喲

歡迎交流,歡迎提問

總結

以上是生活随笔為你收集整理的时间序列的截尾和拖尾_R语言:时间序列(一)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。