JUST技术:探查城市中的异常事件
城市在正常運(yùn)行的過程中,也伴隨著一些異常事件的發(fā)生,例如某一路段突發(fā)的交通擁堵,這些異常事件往往會對我們帶來負(fù)面影響。前幾年,30多萬人涌入上海外灘觀看除夕燈光秀,人群的數(shù)量遠(yuǎn)遠(yuǎn)超出了組織者的預(yù)期。過度擁擠導(dǎo)致了一場悲慘的踩踏事件(圖1),最終造成36人死亡,49人受傷。
圖1 上海外灘踩踏事件
對城市中異常事件的及時(shí)感知甚至提前預(yù)測,能夠幫助政府或是相關(guān)機(jī)構(gòu)及時(shí)應(yīng)對突發(fā)異常,將其帶來的負(fù)面影響降到最低。如果能夠提前預(yù)測即將發(fā)生擁堵的路段,通過對車流的提前疏導(dǎo)能夠避免擁堵的進(jìn)一步擴(kuò)散。上海外灘事件中,如果能及早感知到人群聚集,及時(shí)對人群進(jìn)行限流,悲劇可能就不會發(fā)生。對于不同類型的異常事件,提前感知從而及時(shí)處理都是至關(guān)重要的。
隨著智能設(shè)備的普及以及城市傳感器的大量部署,大量不同類型的城市數(shù)據(jù)被收集、管理與挖掘。這些數(shù)據(jù)具有實(shí)時(shí)、大量、多源等特點(diǎn),且一般具有時(shí)空屬性,包含了豐富的居民出行、城市治安等信息,例如出租車上傳的實(shí)時(shí)地理位置數(shù)據(jù)、市民在社交軟件分享的打卡數(shù)據(jù)。充分利用這些數(shù)據(jù)為我們進(jìn)行城市異常事件的檢測與預(yù)測提供了很好的機(jī)會。本文基于香港科技大學(xué)2020年的一篇綜述:Urban Anomaly Analytics: Description, Detection, andPrediction[1],介紹利用時(shí)空數(shù)據(jù)檢測不同類型的城市異常事件的工作,并在一些重要部分進(jìn)行補(bǔ)充,同時(shí)介紹JUST系統(tǒng)在城市異常事件檢測中的應(yīng)用。
數(shù)據(jù)驅(qū)動(dòng)的城市異常檢測的主要邏輯如圖2,城市中發(fā)生的異常事件會影響到正常的城市運(yùn)行動(dòng)態(tài),這些異常的變化信息會被遍布在城市的智能設(shè)備與傳感器采集到。數(shù)據(jù)驅(qū)動(dòng)的城市異常檢測即是利用這些數(shù)據(jù)描述的城市動(dòng)態(tài)信息,找出其中發(fā)生的異常事件。城市異常事件可以根據(jù)其發(fā)生的主體分為交通異常、人群流量異常、環(huán)境異常和個(gè)體異常。下面將分別對這幾種異常進(jìn)行介紹。
圖2數(shù)據(jù)驅(qū)動(dòng)的城市異常檢測
一、交通異常
交通出行影響到城市中的每個(gè)人。交通異常的產(chǎn)生主要有兩個(gè)原因。第一個(gè)是交通擠塞,通常是由交通事故或交通超載引起的。交通擠塞會導(dǎo)致特定道路的車速減慢或交通量增加,但這些影響只會持續(xù)很短的時(shí)間,如幾分鐘或幾個(gè)小時(shí)。另一個(gè)是道路管理,例如維修或封閉道路,這通常會導(dǎo)致交通量大幅下降,而且其影響會持續(xù)更長時(shí)間。
交通異常檢測主要基于交通流量分析,交通流量數(shù)據(jù)往往采集與部署在道路的傳感器。交通流量異常分析的工作可以分為兩類:局部流量異常分析和群體流量異常分析。第一類工作將路網(wǎng)視為獨(dú)立路段的組合,并檢測或預(yù)測每個(gè)路段的異常,這些方法首先會提取路段的特征信息例如道路上車輛的平均速度,然后通過基于統(tǒng)計(jì)的方法[2][3]或是最近鄰計(jì)算的方法[4]進(jìn)行異常識別,由于這些工作的假設(shè)中將路段之間看作是獨(dú)立的關(guān)系,QQ號出售平臺會忽視實(shí)際路網(wǎng)上重要的流量傳播關(guān)系。群體流量異常分析則主要解決這一問題,他們往往將路網(wǎng)用圖結(jié)構(gòu)表示,交通異常的預(yù)測可以看作是在圖上發(fā)現(xiàn)異常子圖的過程,這些方法可以找到一些有異常的路段集合[5]。同時(shí)交通流量異常往往也可以在人們的社交媒體中呈現(xiàn),[5]中還對異常發(fā)生的同一時(shí)段的社交媒體信息進(jìn)行簡單挖掘,探究交通流量異常的更多信息。然而,很多時(shí)候無法得到大量的實(shí)時(shí)交通數(shù)據(jù)支撐上述交通異常檢測的應(yīng)用。也有工作借鑒交通工程領(lǐng)域利用稀疏數(shù)據(jù)建立正常的交通流量特征[6]。除了及時(shí)的異常檢測,對交通異常的原因分析可能更加能夠幫助到城市規(guī)劃者。[7]中作者為檢測到交通異常的時(shí)空屬性建立因果關(guān)系樹結(jié)構(gòu),其中的頻繁子結(jié)構(gòu)能夠顯示出不同異常的相互影響與潛在的路網(wǎng)設(shè)計(jì)缺陷。
二、人群流量異常
人群流量異常指的是在短時(shí)間內(nèi)城市中某一區(qū)域突然聚集大量人群的事件,是公共安全的主要威脅之一。2014年外灘事件最終造成36人死亡,49人受傷。如果在早期階段檢測到或預(yù)測到人群聚集,這類事故是可以被預(yù)防的。另一方面,一個(gè)地區(qū)人口密度的增加通常可以被很多城市數(shù)據(jù)所感知,例如該地區(qū)周圍基站的蜂窩用戶數(shù)量突然增加,附近地鐵站的出境乘客數(shù)量意外上升[8]。
然而,不同種類的人群流量異常的現(xiàn)象往往與多個(gè)數(shù)據(jù)源相關(guān),為了能夠充分利用多個(gè)數(shù)據(jù)源,[9]作者建模時(shí)考慮到了多源數(shù)據(jù)融合的需求。另一方面,人群流量的異常一般從區(qū)域粒度進(jìn)行檢測,區(qū)域之間的時(shí)空關(guān)聯(lián)一般較為復(fù)雜,而圖結(jié)構(gòu)能夠較好地描述這種關(guān)聯(lián),很多工作借鑒了圖表示網(wǎng)絡(luò)的成果,例如基于圖嵌入[10]或者圖卷積[11]的方式增強(qiáng)對時(shí)空關(guān)系的抽取。
檢測或預(yù)測意外人群的另一個(gè)難點(diǎn)是記錄的事件數(shù)量有限,這給評估不同檢測和預(yù)測算法的有效性帶來了困難。為了豐富數(shù)據(jù)驅(qū)動(dòng)的模型的標(biāo)簽,現(xiàn)有的工作通常將節(jié)日慶典、流行音樂會、體育比賽作為非正常事件。這些事件與潛在的城市異常事件有著相似性,都會導(dǎo)致城市動(dòng)態(tài)與正常狀態(tài)的差異。
三、環(huán)境異常
城市環(huán)境異常主要指城市中基礎(chǔ)設(shè)置與城市環(huán)境出現(xiàn)的異常事件,與公眾安全高度相關(guān)。例如,城市中的火災(zāi)是一種對人民生命財(cái)產(chǎn)的嚴(yán)重威脅。水系污染可能影響到相當(dāng)大區(qū)域內(nèi)居民的正常生活甚至健康。因此,城市環(huán)境異常的檢測同樣十分重要。
環(huán)境異常檢測主要基于部署在相關(guān)基礎(chǔ)設(shè)置與環(huán)境中傳感器采集的數(shù)據(jù)。與其他類型的城市異常不同,環(huán)境異常主要是由環(huán)境變化引起的,而不是由大規(guī)模的人類活動(dòng)引起的,通常在發(fā)生之前沒有明顯的跡象。因此,目前的環(huán)境異常工作并不是直接對城市異常進(jìn)行檢測和預(yù)警,而是側(cè)重于風(fēng)險(xiǎn)評估或原因追蹤。例如,[12]根據(jù)建筑物的狀況信息預(yù)測一棟建筑是否有著火的風(fēng)險(xiǎn),[13]根據(jù)水樣檢抽測的結(jié)果探索了居民區(qū)水污染的原因。
四、個(gè)體異常
個(gè)體異常主要指城市中個(gè)體違法違規(guī)行為導(dǎo)致的異常。例如出租車司機(jī)的故意繞路行為,車輛在非機(jī)動(dòng)車道的非法停放。個(gè)體異常一般影響的人群范圍較小。但是由于一些個(gè)體工作的特殊性,也會產(chǎn)生較大的危害,這些異常需要能夠被及時(shí)檢測。例如危化品司機(jī)將危化品運(yùn)輸?shù)椒欠ㄐ』?#xff0c;這些小化工普遍存在的對危化品不規(guī)范處置行為會對造成極大的安全隱患。時(shí)空個(gè)體異常檢測的另一個(gè)特點(diǎn)是,每一種異常檢測任務(wù)之間較為獨(dú)立,不同的異常檢測模型設(shè)計(jì)的出發(fā)點(diǎn)差異較大。
個(gè)體異常檢測的數(shù)據(jù)主要來自于安置于個(gè)體設(shè)備上的傳感器,如出租車或是危化品車輛上的GPS采集器。出租車?yán)@路的異常檢測是較早被研究的一種時(shí)空異常,模型設(shè)計(jì)主要是對起點(diǎn)終點(diǎn)間正常的行駛模式分布進(jìn)行建模。由于實(shí)際路網(wǎng)形態(tài)較為復(fù)雜,很多方法會選擇對軌跡進(jìn)行網(wǎng)格化表征[14][15][16][17],然后計(jì)算從起點(diǎn)到終點(diǎn)期間走到某一網(wǎng)格的異常程度,所有網(wǎng)格累計(jì)的異常值作為判定標(biāo)準(zhǔn)。在一些實(shí)際應(yīng)用對繞路檢測算法往往有實(shí)時(shí)性的需求,例如網(wǎng)約車公司會希望當(dāng)車輛有繞路傾向時(shí)就及時(shí)發(fā)出警報(bào),一些實(shí)時(shí)算法被提出[16][18],其中,[18]主要通過一種啟發(fā)式的思想計(jì)算當(dāng)前位置到起點(diǎn)的距離和行駛時(shí)間與距離的比例是否正常,利用廣義線性模型來對兩種比例的分布進(jìn)行建模。為了有更好的表征空間,基于深度學(xué)習(xí)的模型也被嘗試用于繞路檢測[17],作者考慮到一組起點(diǎn)終點(diǎn)間有多種可能的路段選擇,用高斯混合模型結(jié)合變分自編碼器的方式將原始軌跡映射到高維空間,不同蔟代表著不同的合理路段選擇,表征離蔟中心較遠(yuǎn)的軌跡被認(rèn)為是異常。
然而上述方法如果要投入實(shí)際應(yīng)用仍有困難,由于不同起點(diǎn)終點(diǎn)間可能的正常路線選擇較為多樣,上述方法往往需要對于每個(gè)起點(diǎn)終點(diǎn)都訓(xùn)練一個(gè)模型,這會有兩個(gè)問題,首先對于一些歷史稀疏的路段,這種方法難以有較好的效果,第二如果要實(shí)際部署這種模型,需要對城市內(nèi)所有起點(diǎn)終點(diǎn)都訓(xùn)練一個(gè)模型,消耗的資源較大。
相對于出租車,危險(xiǎn)化學(xué)品運(yùn)載車輛的異常行為往往會產(chǎn)生更大的危害,因而這些車輛的行駛路線與行為都受到嚴(yán)格的管控,其行駛軌跡數(shù)據(jù)被實(shí)時(shí)上傳。然而仍然有少數(shù)司機(jī)會選擇鋌而走險(xiǎn),將危化品送到一些小化工進(jìn)行非法存儲銷售。為此基于京東城市時(shí)空數(shù)據(jù)引擎JUST設(shè)計(jì)了危化品車輛軌跡特征和地點(diǎn)上游工廠信息檢測非法小化工地點(diǎn)的模型。部署在江蘇南通的危化品監(jiān)管系統(tǒng)在兩個(gè)月的試運(yùn)行期間檢測出了296個(gè)危化品異常駐留點(diǎn),和南通市此前花大力氣排查出的91家要求整改的“小化工”成功匹配64個(gè),匹配覆蓋度達(dá)到70%。
另外,即使是有正常危化品需求的地點(diǎn),過量存儲危化品仍然會有很大安全隱患。在[19]中,作者尋找城市中危化品事故高危區(qū)域,他利用貨車軌跡數(shù)據(jù)計(jì)算所有區(qū)域危化品車輛停放密度分布,通過運(yùn)營商數(shù)據(jù)計(jì)算人流密度分布,如果某一區(qū)域某一時(shí)段同時(shí)有較多的危化品車輛分布和人流分布則被判定為危險(xiǎn)區(qū)域,其成果被應(yīng)用到北京多個(gè)地區(qū)的天然氣整改中。
利用軌跡數(shù)據(jù),還能檢測車輛停放的異常行為。JUST團(tuán)隊(duì)的工作[20]中,我們利用自行車軌跡數(shù)據(jù)檢測停留在非機(jī)動(dòng)車道的車輛,由于自行車在經(jīng)過有車輛停放的道路時(shí)一定會繞行,從大量自行車的軌跡分布可以明顯檢測出這種特征。
五、總結(jié)
以上就是本次關(guān)于利用時(shí)空數(shù)據(jù)探查城市異常事件的分享,主要從四個(gè)分類介紹了當(dāng)前城市中異常事件檢測的進(jìn)展以及JUST系統(tǒng)中城市異常事件檢測的應(yīng)用。未來JUST系統(tǒng)還將集成更多城市異常檢測算法,助力城市的安全發(fā)展。
總結(jié)
以上是生活随笔為你收集整理的JUST技术:探查城市中的异常事件的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 在unity2d同屏显示9千人
- 下一篇: 智慧工厂如何运转?飞凌FCU2303-5