paper笔记 | 城市计算概述(郑宇)
1 城市計算的概念和框架
1.1 城市計算的定義
城市計算是一個通過不斷獲取、整合和分析城市中多種異構大數據來解決城市所面臨的挑戰(如環境惡化、交通擁堵、能耗增加、規劃落后等)的過程。
1.2 城市計算的框架
基本框架包括 城市感知和數據獲取——城市數據管理——城市數據分析——服務提供 四個環節
城市計算是一個多數據多任務的系統。
1.3 城市計算的核心問題
1)城市感知(計算)。利用城市中現有的資源不斷自動感知城市的韻律。人作為傳感器參與到城市感知過程(亦稱為群體感知)。城市感知不再只是感知的過程,也包含能夠從復雜、隱晦、缺失和非均勻分布的數據中獲取有效知識的計算環節。
2)海量異構數據的管理。如何管理和整合大規模的異構數據是一大難題。尤其是在一個應用中使用多種數據時,只有提前建立起不同數據之間的關聯,才能讓后面的分析和挖掘過程變得高效、可行。
3)異構數據的協同計算
傳統的機器學習往往只能基于單一數據。在城市計算的很多應用中效果并不理想。在保證知識提取深度的同時,如何提高對大數據的分析效率,以滿足城市計算中眾多實時性要求較高的應用也是一個難題。數據維度的增加也容易導致數據稀疏性問題。
4)虛實結合的混合式模式。比如云加端模式。
1.4 城市計算的應用分類
城市計算主要涉及但不限于的7類應用:城市規劃、智能交通、城市環境、城市能耗、城市經濟、社交和娛樂、城市安全。
2 城市計算的主要技術
2.1 傳感器技術
1)傳感器網絡技術,實現現有專業傳感器之間的互聯互通,完成數據的快速收集。
2)主動參與式感知技術。用戶主動分享自己獲取的數據來共同完成一個復雜的任務。
3)被動群體感知。利用非專門為城市計算設立的基礎設施收集用戶在使用時產生的數據,將這些數據融合到一起就能很好地反映城市的規律。特點是,被動式群體感知中的用戶并不知道自己的數據將作何使用,甚至不知道自己在產生數據。
2.2 數據管理技術
1)流數據管理技術。大量的傳感器數據都以流的形式輸入。
2)軌跡管理技術。交通流、人的移動、以及帶位置標簽的社交媒體都可以表示為軌跡數據(即帶有時間戳并按時間排序的點序列)。常用的對軌跡的處理技術包括:地圖匹配算法、軌跡壓縮、軌跡搜索、軌跡頻繁模式挖掘等。
3)圖數據管理技術。社交網絡中人的關系、不同地區之間的人口流動、道路上的交通流等都可表達為圖模型。城市計算中常用帶有時空屬性的圖模型,即每個節點都有空間坐標信息,圖中邊和點的屬性(甚至圖結構)會隨時間而變化。
4)時空索引技術。有效的索引可以大大提高數據提取的效率,利用時空索引技術將不同種類的數據(如文本、車流量)關聯和組織起來,為之后的高效數據挖掘和分析做好準備。
3.3 數據挖掘技術
選擇可以應用到城市計算中的模式發現、統計學習和人工智能方法等需要重點考慮以下兩個因素。
1)從異構數據中學習到相互增強的知識
方法一:分別從不同的數據中提取特征,然后簡單地將這些特征直接拼接并歸一化到一個特征向量里,輸入到機器學習模型。但由于不區分不同數據的特性,實踐證明這種方法并不是最有效的。
方法二:在計算模型的不同階段先后使用不同數據。
方法三:將不同的數據分別輸入到同一個計算模型的不同部分。
2)應對數據的稀疏性
應對數據的稀疏性通常可采用以下三種方法:
①采用矩陣(或張量)分解算法和協同過濾,數據融合方法的一種。
②使用半監督學習算法或轉移學習算法。半監督學習算法從具有不同分布的其他數據源中獲取知識,從而解決一個機器學習任務中訓練樣本不足的問題。
③基于相似性的聚類算法。
3.4 優化技術
時空搜索技術和路勁優化相結合、線性規劃、動態優化
3.5 混合數據的可視化技術
可視化以直觀的方式幫助我們理解獲取的知識和模式。與單一數據不同,城市計算中的可視化技術需要同時考慮多個維度,其中,空間和時間是兩個至關重要的維度。
總結
以上是生活随笔為你收集整理的paper笔记 | 城市计算概述(郑宇)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 软件工程期末复习8-软件体系结构与设计模
- 下一篇: 计算机箱图和结构,机箱结构设计