交通流分析1:《基于大数据的城市公路交通流短时预测研究_张红》阅读总结
大概讀了一下,第6節小波分析那里實在沒有看懂。
如果有理解不對的地方歡迎批評指正。
建模方法
這篇論文選用的是時間序列模型和小波理論,小波理論那里我實在沒看懂,說說他基于時間序列模型的組合建模方法,這是選擇時間序列模型的理由:
作者是將整個交通流數據分解為四個分項(即從四個角度去看待的交通流數據):周期分項、趨勢分項、線性分項和非線性分項:
其中周期分項就是交通流呈現出的周期性(比如每天肯定會有早晚高峰、每周肯定都是周末車流量大,交通流肯定是呈周期性變化的,每個周期之間都會有相似性)。用的是譜分析,也就是空間坐標系到極坐標系上的分解:
趨勢特征就是每天肯定都會有早、晚高峰,高峰期車流量會比非高峰期大,這就是數據的趨勢。
周期分項和趨勢分項都是從宏觀上看數據,和數據樣本的屬性關系比較大(可能大城市高峰期時間更長,小城市高峰期時間更短),你換一組別的地方的交通流數據,可能就會有過擬合的問題,屬于不同樣本自帶的屬性,對于訓練可以運用于多個交通流樣本的泛化模型是不利的。
所以我們把他去掉,然后分析線性分項和非線性分項。
線性分項適用于非高峰期數據,這里的數據比較平穩,實質上是對序列均值的分析;而非線性分項主要用于分析高峰期數據,這里的數據波動情況較大。
得出的結論:
其中周期和趨勢具有長相關性,我的理解就是這兩項是宏觀的,是和數據樣本本身的情況密切相關的,可能對于這一組數據是一個情況,對于另一組數據就是另一種情況了。而線性和非線性分項是微觀的,是與數據樣本相對獨立的,較為純粹的“交通流”的、內在的。所以周期和趨勢由于其與數據樣本的高相關性、會削弱模型對于不同樣本數據的泛化能力。
數據預處理
主要是兩點:
1.指數平滑法處理缺失值和異常值:
2.min-max歸一化與z-score歸一化
z-score歸一化由于考慮到了方差,相比min-max歸一化能夠更好的處理極值過分影響整體數據的情況
定義
1.基礎量:交通流量
2.占有率,其實就是觀測時間內有車通過的時間占比:
總結
以上是生活随笔為你收集整理的交通流分析1:《基于大数据的城市公路交通流短时预测研究_张红》阅读总结的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据结构与算法--7.树的基础知识
- 下一篇: spss 因子分析