MVGCN 人群流量预测模型 笔记
Predicting Citywide Crowd Flows in Irregular Regions Using Multi-View Graph convolutional Networks 筆記
作者:Junkai Sun, Junbo Zhang, Qiaofei Li, Xiuwen Yi, Yu Zheng
來源:arXiv:1903.07789v2 [cs.CV] 17 Jul 2020
1 論文背景與動機
? ? ? ?先前的工作主要集中在預測規則的網格化區域的人群流動。然而,城市實際上被道路網絡隔開,非常不規則。預測城市不規則區域的人群流動,對于交通控制、風險評估和公共安全意義重大。
? ? ? 人群流量預測問題是一個時空圖(STG)預測問題,不規則區域為圖節點,區域間過渡流用來構造邊。但由于不同區域之間的相互作用和空間相關性,不規則區域人群流量預測比較困難,受到許多因素影響:
? ? ? 1)STG不同頂點之間的相互作用和空間相關性。
? ? ? 2)不同時間間隔之間的多重時間相關性:鄰近性、周期性、趨勢;
? ? ? 3)復雜的外部因素(天氣、事件)和元特征(一天的時間,周末/工作日)
? ? ? ?本文提出利用空間圖卷積建立一個多視角圖卷積網絡(MVGCN),用于人群流量預測問題,其中不同視角能捕捉到上述不同的因素。本文使用四個數據集來評估MVGCN,結果表明,MVGCN方法優于最先進的方法。
2論文創新
2.1提出一種GCN變體,它可以捕捉不同節點之間的空間相關性。設計多視圖融合模塊,將不同視圖的多個潛在表示融合在一起。多視圖融合有效地利用不同視圖基于其特性的輸出。
2.2 提出了一個綜合框架,包括數據預處理、地圖分割和地圖聚類、過渡流構建圖、GCN預測人群流量。
3論文模型
?該框架由數據準備和模型學習兩個階段組成:
? ? 人群流量預測問題——STG預測問題:
? ? 節點——不規則區域;邊——流出和區域之間的過渡流。
?
? ? ?Inflow-- 給定時間間隔內其他區域進入某區域的人群的總流量;
? ? ?Outflow--給定時間內離開某區域到其他區域的人群的總流量。
?
? ? ? 通過在道路上行駛的汽車/自行車的數量、行人的數量、在公共交通系統上行駛的人數來衡量人群的流量。利用車輛的GPS軌跡來測量交通流量。
?map segmentation:
? ? ?1)利用形態學圖像處理技術來處理區域劃分任務,即將地圖劃分為2400個×2400個小網格單元,并將每個路點映射到其對應點網格單元,從而獲得二值圖像,1和0分別代表路段和空白區域。
? ? ?2)應用dilation和thinning得到路網骨架。
? ? ?3)使用連接分量標記算法(CCL)獲得所有標記的不規則區域的位置,該算法通過聚類“1”標記的網格找到單個區域。
Map clustering:
? ? ? ?把兩個低層區域之間的邊緣權重定義為一個時段內的平均人群流量之間的Spearman's?rankcorrelation?coefficient。 小區域被聚集成一些高級別區域
Graph Construction——使用歷史區域過渡流的拓撲圖。
? ? ? 從流量數據中選擇一段時間,比如一到兩個月。 然后,可以統計成對區域之間的有效時間切片。有效時間片是指考慮軌跡數據的噪聲,當區域過渡流>α 當區域過渡的有效時間切片比大于閾值β時,PLA一個二進制值無向邊來連接它們。α=3,β=0.1。
? ? ? 每個頂點vi∈V都有一個地理空間位置pi和時變屬性。這些屬性在時間t上可以看作是圖信號Xt∈RN×C,其中Xt[i,:]∈RC表示節點vi的C個屬性,例如流入和流出(C=2)。 兩個區域之間的邊緣是由區域過渡流構造的。 兩個區域之間的邊緣是由區域向過渡流構造的,A中的二進制入口值表示兩個區域在交通流中是否相關。
? ? ? 模型輸入:原始軌跡和道路網絡。
? ? ? 模型輸出:城市的不規則區域的人群流入和流出(inflows/outflows)。
4 算法步驟
4.1 給定一個鄰接矩陣A,根據空間距離為現有邊分配空間權值。考慮了在STG中頂點的地理空間位置。 S∈RN×N是修正的鄰接矩陣,;
4.2 ?ω∈RN×N是通過閾值高斯核加權函數計算的空間加權鄰接矩陣。 dist(pi,pj)是指節點vi和vj之間的地理距離;θ和κ是控制鄰接矩陣的尺度和稀疏性的兩個參數。
4.3 ?stack M spatial graph convolutional layers? 卷積整合了地理空間信息
4.4 ?為捕捉M-hop空間相關性和相互作用,疊加了M空間圖卷積層。 當M很大時,我們需要一個非常深的網絡。 殘差學習允許神經網絡具有100層的超深結構。通過疊加多個基于GCN的殘差單元,可以構建非常深的神經網絡來捕獲多跳空間依賴
4.5?提出一種多視圖融合方法,將許多流視圖的潛在表示與兩個全局視圖(外部和元數據)融合。 不同的區域具有不同的時間性質。采用基于參數矩陣的融合方法將五個GCN的輸出融合為時間視圖。 W1—W5分別調節受臨近、日周期、周周期、月趨勢和季度趨勢影響的程度。
?
4.6 ?Iext和元數據Imeta分別將喂入不同的FC層中,以獲得不同的潛在表示?ext和?meta。 只需連接嵌入模塊的所有輸出,通過整形添加FC層,獲得Ocon∈RN×C。
4.7不同的因素可能以不同的方式改變流動。利用兩種不同的融合方法:對于逐步變化,采用求和融合方法,?對于突然的變化,用基于門控機制的融合,其中σ是一個近似的門控函數。當Ocon的級聯表示捕獲一些特殊的外部信息,如暴雨天氣時, 由于sigmoid 函數性質,將突然增加,相比Ocon成為一個更大的值。而在大多數常見的情況下,它應該接近于零,沒有突然的變化。基于兩種融合方法,最終輸出計算為
4.8 胡伯損失是和折衷, δ為閾值(默認值為1).Huber損失結合了零附近平方誤差損失和絕對誤差損失理想性質。
5 論文實驗
5.1 數據集
1)TaxiNYC:2011年1月1日—2016年6月30日紐約市的出租車GPS數據。 將NYC劃分為100個不規則區域,據過渡流和區域間的地理距離建立圖,計算人群流量。
2)TaxiBJ:北京出租車GPS數據,四個時間間隔:2013年7月1日—2013年10月30日,2014年3月1日—2014年6月30日,2015年3月1日—2015年6月30日,2015年11月1日—2016年4月10日。構圖和人群流量計算方法與TaxiNYC相同。
3)BikeDC:取自華盛頓特區自行車系統。行程數據包括:行程持續時間,起止站ID,起止時間。共有472個站點。對于每個車站,兩種流量,流入是進入自行車的數量,流出是簽出自行車的數量。120個不規則區域。構造了這些區域之間具有過渡流和地理距離的圖。
4)BikeNYC:取自紐約自行車系統,2013年7月1日—2016年12月31日軌跡數據。共有416個車站。 刪除了不可用的自行車站點,并將其余的站點集中到120個區域。紐約市的圖形構造和自行車流量計算方法與BikeDC相同。
?
上述四個數據集:測試集——最后四周的數據;訓練集——所有剩余數據。
? ? ?本文過站點或區域之間的地理距離建立通勤網絡(即圖),站點或區域可以看作是圖中的節點。 每個站點都有地理空間位置。 對每個區域,近似地使用區域中心位置的地理空間位置。
5.2 對比方法
time-series models:?? ?1)HA: Historical average??? ?2)VAR: Vector auto-regressive
use the spatial and temporal features? 3)GBRT: Gradient boosting decision tree
neural networks:
? ? ? ?4)FC-LSTM: Encoder-decoder framework using LSTM
? ? ? ?5)GCN: ?3-layer supervised graph convolutional network
? ? ? ?6)DCRNN: ?2-layer supervised diffusion convolutional recurrent neural network
? ? ? ?7)ST-MGCN: Forecasting ride-hailing demand with spatiotemporal multi-graph convolution network.
based on Gaussian?Markov random fields:
? ? ? ?8) FCCF: Forecasting Citywide Crowd Flow model based on Gaussian Markov random fields
? ? ? ?9)FCCFno Trans
? ? ? ? 說明:1)利用TensorFlow實現基于神經網絡的模型,并通過反向傳播和Adam[17]優化進行訓練。? 2)MVGCN模型以及大多數對比方法都用TensorFlow實現,模型訓練過程在兩個具有64GB RAM和16GB GPU內存的TeslaV100GPU上執行。訓練時間因時間而異在不同的數據集上30分鐘到3小時。
5.3 ?預處理
? ? ? ?使用Min-Max歸一化方法將數據縮放到范圍[1,1]或[0,1]。在評估中,將預測值重新縮放到正常值,并與真值比較。
對于外部因素,使用獨熱編碼將元數據、假日和天氣條件轉換為二進制向量 使用Min-Max歸一化將溫度和風速縮放到[0,1]。
5.4 環境設置
? ? ? 模型超參數設置如下:
? ? ? ?說明:對于所有訓練的模型,只選擇在驗證集上得分最好的模型,并在測試集上進行評估。
5.5?評價指標
5.6?實驗結果
實驗證明: MVGCN在所有數據集上表現最好(除了MAE在出租車NYC)。
5.7??Results on sudden changes
???圖7給出MVGCN與五條基線在突發變化情況下的比較,這可能是由異常天氣或交通事件引起的。計算所有區域每個時隙t與t-1的交通流量差;將所有交通流差絕對值按降序排序,并將前5%時隙定義為發生突然變化的時間點,剩余95%時隙為正常情況。實驗表明:MVGCN大大優于所有其他方法,特別是在出租車TaxiBJ。
? ? ? ?如圖8所示, MVGCN模型在正常情況和突然變化方面都比其方法表現得更好,此外,在后者取得明顯改進。原因可能是MVGCN有效地建模天氣數據。
5.8 Results on multi-step prediction
? ? ? 圖9給出了基于RMSE和MAE的多步預測結果。對于單步預測模型,MVGCN,我們為不同的時間步驟訓練不同的模型。
對于包括FC-LSTM和DCRNN在內的多步預測模型,使用前6個時間步長作為輸入序列,接下來的6次作為目標序列,訓練模特。 步數從1到6MVGCN 是魯棒的,RMSE和MAE都有小的增加,在所有6時間步長中都達到了最佳效果。
隨著時間步的增加,原始GCN是不穩健的。這表明如果我們以簡單的方式將現有的模型應用于人群流量預測,它就不起作用。DCRNN表現不太好,因為它也只使用最近的時間步中的序列,導致它無法捕獲周期、趨勢和外部因素。
5.9 ?Effects of Different Components
? ?圖10展示了基于RMSE和MAE的不同時間視圖組合的不同實驗效果,包括最近(視圖1)、每日(視圖2)、每周(視圖3)、每月(視圖4)、季度視圖(視圖5)。 只要考慮最近的觀點,就會得到一個糟糕的結果當考慮到日視圖時,結果得到了很大改善,表明周期性是交通流模式的重要特征。此外,隨著更多的時間視力圖的考慮,結果變得越來越好。
5.10 ?Geospatial position
? ? ? ?沒有地理空間信息,卷積層被降級為普通圖卷積。表4顯示:沒有地理空間位置,RMSE從23.15增加到23.64,MAE也變得更差,證明了空間圖卷積的有效性。
5.11 Global information
? ? ? ?論文比較了MVGCN在兩種設置下的性能:去除外部因素或元數據,如表4所示。通過消除外部因素,RMSE從23.15增加到24.41。 同樣,沒有元數據,RMSE增加到23.23。 結果表明,外部因素/Meta數據影響STG的預測。
5.12 Huber loss and number of GCN layers
??? ? 為了進一步研究不同損失函數和GCN層數的影響。論文進行了一些消融研究,并報告了在TaxiNYC數據集上,不同空間圖卷積層或損失函數的實驗結果。
? ? ? ?圖11顯示,使用RMSE、MAE或Huber作為損失函數的性能首先下降,然后隨著GCN層數量的增加而增加。當GCN層數為5時,會出現最佳結果。
? ? ? ?圖11表明,深網絡產生了更好的結果,但更深的網絡仍然造成了共同的問題較高的預測誤差。 早期停止的訓練時間隨模型深度的增加而增加。
?
? ? ? ? 為了驗證殘差GCN層的影響,論文將有殘差的GCN單元與無殘差的普通GCN層比較。,沒有剩余連接。
? ? ? ? 圖12顯示,兩者在淺層網絡中的表現相似。但當GCN的數量增加到5,殘差網絡可以獲得更好的結果,并且它們都比淺層網絡在適當的深度設置時表現得更好。
6. CROWD FLOW FORECASTING SYSTEM IN IRREGULAR REGIONS
? ? ? 論文作者在內部開發了一個可以訪問的不規則區域的人群流量預測演示(稱為城市流量)
? ? ? ?圖13(a)顯示了系統中某個區域的流入和流出結果,其中綠線表示過去14小時的地面真實流入或流出,藍色線表示14小時內的預測結果,橙色線表示未來10小時內的預測值。
? ? ? ?可以看到,綠色和藍色線條有非常接近的值和相似趨勢,這意味著MVGCN可以在交通流量預測系統中有效和良好地工作。
? ? ? ? 圖13(b)顯示了整個城市不同時間戳的總體流量變化的另一個函數視圖。 在早晨的高峰時間,大多數地區有更大的人群流動,因為人們從家里出發,而在下午,大多數人在工作或休息。
?
總結
以上是生活随笔為你收集整理的MVGCN 人群流量预测模型 笔记的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vs2015水晶报表(Crystal R
- 下一篇: win7怎么修改服务器端口,教你在Win