滑动窗口在重构数据集的作用
step1:使用滑動(dòng)窗口重構(gòu)數(shù)據(jù)集
給定時(shí)間序列數(shù)據(jù)集的數(shù)字序列,我們可以將數(shù)據(jù)重構(gòu)為看起來像監(jiān)督學(xué)習(xí)問題。
我們可以通過使用以前的時(shí)間步作為輸入變量并使用下一個(gè)時(shí)間步作為輸出變量來做到這一點(diǎn)。
通過觀察重構(gòu)后的數(shù)據(jù)集與原本的時(shí)間序列,我們可以總結(jié)出如下幾點(diǎn):
使用先前的時(shí)間步來預(yù)測(cè)下一個(gè)時(shí)間步的方法稱為滑動(dòng)窗口法。在統(tǒng)計(jì)和時(shí)間序列分析中,這稱為滯后或滯后方法。
下面將著重關(guān)注一下幾點(diǎn):
step2:多元時(shí)間序列如何重構(gòu)?
- 單變量時(shí)間序列:這些數(shù)據(jù)集每次僅觀察到一個(gè)變量,例如每小時(shí)的溫度。上一節(jié)中的示例是一個(gè)單變量時(shí)間序列數(shù)據(jù)集。
- 多變量時(shí)間序列:這些是每次觀察到兩個(gè)或多個(gè)變量的數(shù)據(jù)集。
這里給出一個(gè)二元時(shí)間序列
每個(gè)時(shí)間步有兩個(gè)觀察值。我們還假設(shè)我們只關(guān)心預(yù)測(cè)measure2。
我們可以將這個(gè)時(shí)間序列數(shù)據(jù)集重新構(gòu)建為一個(gè)窗口寬度為 1 的監(jiān)督學(xué)習(xí)問題。
這意味著我們將使用 measure1 和 measure2 的前一個(gè)時(shí)間步長(zhǎng)值。我們還將獲得measure1的下一個(gè)時(shí)間步長(zhǎng)值。然后我們將預(yù)測(cè)measure2的下一個(gè)時(shí)間步長(zhǎng)值。
這將為我們提供 3 個(gè)輸入特征和一個(gè)輸出值來預(yù)測(cè)每種訓(xùn)練模式。
我們可以看到,就像上面的單變量時(shí)間序列示例一樣,我們可能需要?jiǎng)h除第一行和最后一行來訓(xùn)練我們的監(jiān)督學(xué)習(xí)模型。
這個(gè)例子提出了一個(gè)問題,如果我們想預(yù)測(cè)下一個(gè)時(shí)間步的measure1和measure2怎么辦?
使用上面相同的時(shí)間序列數(shù)據(jù)集,我們可以將其表述為一個(gè)監(jiān)督學(xué)習(xí)問題,我們預(yù)測(cè)measure1和measure2的窗口寬度相同,如下所示。
step3:單元時(shí)間序列預(yù)測(cè)多個(gè)時(shí)間步長(zhǎng)如何重構(gòu)?
我們可以看到,第一行和最后兩行不能用于訓(xùn)練監(jiān)督模型。
這也是一個(gè)很好的例子來展示輸入變量的負(fù)擔(dān)。具體來說,監(jiān)督模型只有X1可用于預(yù)測(cè)y1和y2。
需要對(duì)您的問題進(jìn)行仔細(xì)的思考和實(shí)驗(yàn),以找到能夠產(chǎn)生可接受的模型性能的窗口寬度。
翻譯自
https://machinelearningmastery.com/time-series-forecasting-supervised-learning/
總結(jié)
以上是生活随笔為你收集整理的滑动窗口在重构数据集的作用的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 海思机顶盒fastboot烧写成功会自动
- 下一篇: 前向验证对于模型的更新作用