pgsql 两个时间字段相减_如何在Excel做专业的时间序列分析
一、工具產(chǎn)生背景
在生產(chǎn)中我們常會根據(jù)歷史數(shù)據(jù)去預(yù)測未來的發(fā)展趨勢。比如客戶投訴量、用戶留存率、頁面點(diǎn)擊率等等。
對于預(yù)測功能的需求多但是具備相應(yīng)能力的分析師卻很少。想做出一份精準(zhǔn)的預(yù)測需要具備很多專業(yè)的知識和技能。因此有必要做一個分析工具,即簡單易用又能實(shí)現(xiàn)良好的預(yù)測效果。因此開發(fā)了該ARIMA的預(yù)測模型以實(shí)現(xiàn)在Excel中輕輕松松即可完成一份準(zhǔn)確的預(yù)測。
ARIMA是常用的時間序列分析模型,且其預(yù)測效果得到了廣泛的公認(rèn)。因此,可以考慮將該模型可視化,提供給用戶。
二、使用工具
點(diǎn)擊SqlCel選項(xiàng)卡下的“時序分析”按鈕,如下:
將彈出以下對話框:
接下來具體介紹功能的使用:
1、選擇數(shù)據(jù)集
選擇的數(shù)據(jù)集需滿足以下條件:
1)首行是字段
2)總共兩個字段,第一個字段是日期時間,第二個字段是對應(yīng)的數(shù)值
如下:
在本例中,我們使用經(jīng)典的airpassengers數(shù)據(jù)集。
2、周期
周期是以下所有分析的基礎(chǔ),默認(rèn)值是12。周期設(shè)置不同對結(jié)果有較大影響。
周期體現(xiàn)的是一組數(shù)據(jù)的周期性。它可以通過用戶的個人經(jīng)驗(yàn)來設(shè)置。也可以通過相關(guān)圖來判斷。現(xiàn)在介紹相關(guān)圖判別法。我們先設(shè)置一個比較大的周期,然后點(diǎn)擊“相關(guān)圖”按鈕將產(chǎn)生時間序列的相關(guān)圖,觀察自相關(guān)圖(Autocorrelation),一般取相關(guān)系數(shù)超出置信邊界,且系數(shù)較大、階數(shù)較大的那一階為周期:
此圖中可以比較明顯的觀察出周期為12。
3、平穩(wěn)性檢驗(yàn)
平穩(wěn)性檢驗(yàn)用于判斷數(shù)據(jù)的平穩(wěn)性。點(diǎn)擊“平穩(wěn)性檢驗(yàn)”按鈕可以輸出時序圖和DF檢驗(yàn)表(單位根檢驗(yàn))。如下:
通過時序圖可以觀察數(shù)據(jù)趨勢和以周期為窗口的滾動平均值及滾動標(biāo)準(zhǔn)差。滾動均值可以消除周期性并體現(xiàn)數(shù)據(jù)的趨勢性,滾動標(biāo)準(zhǔn)差可以體現(xiàn)數(shù)據(jù)的波動性大小。
DF檢驗(yàn)以數(shù)字的形式判斷數(shù)據(jù)的平穩(wěn)性,可以給出更嚴(yán)謹(jǐn)?shù)呐袛鄻?biāo)準(zhǔn)。判斷規(guī)則如下:
1)如果P值小于0.05,那么我們即可斷定數(shù)據(jù)是平穩(wěn)的;
2)如果P值大于0.05,當(dāng)統(tǒng)計(jì)量大于0且小于關(guān)鍵值(1%)或統(tǒng)計(jì)量小于0且大于關(guān)鍵值(1%),可以酌情接受平穩(wěn)性假設(shè);
3)如果統(tǒng)計(jì)量大于關(guān)鍵值(1%)則拒絕平穩(wěn)性假設(shè);
4)P值并不是越小越好,盡量通過少量的平穩(wěn)性處理步驟滿足P值可選即可。
4、平穩(wěn)性處理
ARIMA模型只能用來預(yù)測平穩(wěn)性序列,因此平穩(wěn)性處理至關(guān)重要。每次平穩(wěn)性處理之后都會自動做一次平穩(wěn)性檢驗(yàn)。
1)輸出
如果勾選“輸出”復(fù)選框則每次處理后的結(jié)果都可以即時輸出到當(dāng)前工作簿。如果取消勾選則僅做數(shù)據(jù)處理,不輸出數(shù)據(jù)。默認(rèn)情況下是勾選的。
2)分解
分解操作可以自動將原數(shù)據(jù)分解成趨勢性、季節(jié)性和殘差三個部分。如下圖所示:
數(shù)據(jù)分解會忽略其它所有平穩(wěn)性處理操作僅處理原始數(shù)據(jù),并且數(shù)據(jù)分解之后不可以再做其它平穩(wěn)性處理。后續(xù)的模型擬合和預(yù)測僅在分解后的數(shù)據(jù)上進(jìn)行。
如果在分解操作前需要做對數(shù)變換,則可在Excel里面先用LN函數(shù)處理原始數(shù)據(jù),最后用EXP函數(shù)還原預(yù)測結(jié)果。
3)差分
差分是對等周期間隔的數(shù)據(jù)線性求減,它是最常用的平穩(wěn)性處理方法,是ARIMA模型的重要組成部分。
差分的期數(shù)是線性相減的周期間隔,一般應(yīng)小于3,或設(shè)為周期數(shù)。差分復(fù)選框可多次勾選或取消勾選,每次勾選都會在原數(shù)據(jù)的基礎(chǔ)上做一次差分處理。
需要注意的是如果需要做對數(shù)變換和移動平均操作需在差分前進(jìn)行。
4)對數(shù)變換
對數(shù)變換要求所有的數(shù)據(jù)均大于0。它可以很好的消除數(shù)據(jù)的波動性(趨勢性和周期性)。是平穩(wěn)性處理比較理想的選擇。
5)移動平均
移動平均可以很好的消除周期性。但是它會引起預(yù)測結(jié)果較大的波動,它對近期的預(yù)測具有較好的效果。
5、模型擬合
模型擬合的關(guān)鍵是設(shè)置AR模型的階數(shù)p和MA模型的階數(shù)q。選擇階數(shù)可以通過觀察相關(guān)圖判斷或者通過AIC準(zhǔn)則或BIC準(zhǔn)則自動判斷。
1)相關(guān)圖觀察
完成平穩(wěn)性處理后,我們可以點(diǎn)擊“相關(guān)圖”按鈕生成當(dāng)前數(shù)據(jù)的相關(guān)圖。自相關(guān)圖(Autocorrelation)用于確定MA(q),偏自相關(guān)圖(Partial Autocorrelation)用于確定AR(p)。一般從自相關(guān)系數(shù)超出置信邊界的階數(shù)中選取階數(shù)較小且系數(shù)較大的階數(shù)作為p和q的值。然后通過檢驗(yàn)?zāi)P蛿M合優(yōu)度適當(dāng)調(diào)整p和q的值
2)AIC準(zhǔn)則
AIC準(zhǔn)則以嚴(yán)謹(jǐn)?shù)慕y(tǒng)計(jì)量選擇p和q的值。首先設(shè)定最大階數(shù)(maxlags),然后點(diǎn)擊“AIC準(zhǔn)則”按鈕。將生成AIC準(zhǔn)則列表和AIC選擇結(jié)果。AIC準(zhǔn)則的判斷標(biāo)準(zhǔn)是AIC值越小對應(yīng)的p和q階數(shù)越合理。如下:
其中最大階數(shù)(maxlags)設(shè)置的越大,判斷的時間越長。
3)BIC準(zhǔn)則
BIC準(zhǔn)則的選擇方法與AIC準(zhǔn)則相似。當(dāng)兩者在模型選擇上不同時,我們可以參考?xì)埐頓W檢驗(yàn)從而得出更優(yōu)的一個選擇。
模型擬合
設(shè)定p和q后點(diǎn)擊“開始擬合”按鈕將會輸出擬合優(yōu)度檢驗(yàn)報(bào)告,如下:
AIC和BIC的值越小說明模型擬合得越充分。殘差DW檢驗(yàn)的值越接近2說明模型擬合越充分。
同時還會輸出殘差QQ圖,如下:
如果QQ圖中的點(diǎn)基本圍繞著直線分布,說明殘差基本符合正態(tài)分布,原數(shù)據(jù)的信息提取得比較完全,模型擬合較充分。
6、時序預(yù)測
模型擬合完畢接下來即可使用擬合好的模型進(jìn)行預(yù)測了。設(shè)定向前預(yù)測的期數(shù),然后點(diǎn)擊“開始預(yù)測”。此時輸出預(yù)測結(jié)果的時序圖,如下:
同時可向當(dāng)前工作簿輸出預(yù)測的結(jié)果值。
三、預(yù)測原理
根據(jù)平穩(wěn)性處理方法的不同分兩種預(yù)測方法。
1)分解
ARIMA模型僅預(yù)測分解后的平穩(wěn)序列(殘差),趨勢性和季節(jié)性則是根據(jù)分解后的數(shù)據(jù)分別預(yù)測,之后匯總?cè)糠诸A(yù)測結(jié)果即為最終的預(yù)測結(jié)果。
2)其它平穩(wěn)性處理
ARIMA模型僅預(yù)測處理后的平穩(wěn)序列(殘差),所作的每一步平穩(wěn)性處理操作都會進(jìn)行還原,在還原平穩(wěn)性操作之前會對平穩(wěn)性處理前的數(shù)據(jù)做預(yù)測,之后匯總殘差預(yù)測和每一步還原結(jié)果的預(yù)測值即為最終的預(yù)測結(jié)果。
總結(jié)
以上是生活随笔為你收集整理的pgsql 两个时间字段相减_如何在Excel做专业的时间序列分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: tms570 can 接收大量数据_CA
- 下一篇: docker always_介绍两款Do