R语言对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归
通過對用電負(fù)荷進(jìn)行聚類,我們可以提取典型負(fù)荷曲線,提高隨后的用電量預(yù)測的準(zhǔn)確性。
我將向您展示第一個用例,即通過K-medoids聚類方法提取典型的電力負(fù)載曲線。
我們必須以某種方式降低維度。最好的方法之一是使用時間序列表示來降低維度,減少噪音并強調(diào)時間序列的主要特征。
我們使用一種基本的基于模型的表示方法 - 平均季節(jié)性輪廓。另一個非常重要的通知是,時間序列的歸一化是時間序列的每個聚類或分類之前的必要過程。
使用K-medoids(pam函數(shù)從cluster包)聚類方法 。
“最佳”數(shù)量的簇是7 。
我們用7個聚類數(shù)繪制聚類結(jié)果。
現(xiàn)在,讓我們嘗試一些更復(fù)雜的方法來提取季節(jié)性分布 - GAM回歸系數(shù)。
可視化結(jié)果:
再次聚類的最佳數(shù)量是7.讓我們繪制結(jié)果。
提取的消費情況比平均季節(jié)性情況更平滑。藍(lán)色虛線與每日和每周季節(jié)性系數(shù)相接。
我將向您展示一些非數(shù)據(jù)自適應(yīng)表示的聚類結(jié)果,讓我們選擇例如DFT(離散傅立葉變換)方法并提取前48個DFT系數(shù)。
因此,基于模型的時間序列表示在這種用例中非常有效(因此典型的剖面提取)。
FeaClip是從限幅表示特征提取方法。建議將FeaClip旁邊的開窗方法用于時間序列的每一天。
我們繪制結(jié)果
我們可以看到,現(xiàn)在出現(xiàn)了2個“肘部”。最大的變化是在2到3個簇之間,所以我會選擇3號。
結(jié)論
在本教程中,我展示了使用時間序列表示方法來創(chuàng)建更多消費者的特征。
轉(zhuǎn)載于:https://www.cnblogs.com/tecdat/p/11060157.html
總結(jié)
以上是生活随笔為你收集整理的R语言对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 最终屏幕录制方案
- 下一篇: 盘点2010年十大出版事件 文著协“宣战