當前位置：首頁 > 人工智能 > ChatGpt >内容正文

ChatGpt

【论文解读】百度提出新冠高风险小区预警算法，AAAI21收录！

發(fā)布時間：2025/3/12 ChatGpt 31 豆豆

生活随笔收集整理的這篇文章主要介紹了【论文解读】百度提出新冠高风险小区预警算法，AAAI21收录！小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

編：夕小瑤

幾個月前，小屋推送了一期上帝視角看新型冠狀病毒（COVID-19）對公眾出行影響的頂會論文解讀——《這篇頂會paper，講述了疫情期間憋瘋的你和我》，這篇有趣的paper來自百度地圖團隊，發(fā)表在KDD2020。

幾個月后，新冠病毒仍在全球范圍肆虐，并對人們的日常工作與生活產(chǎn)生了嚴重的影響。與此同時，社會責任感爆棚的百度研究人員再次發(fā)揮時空大數(shù)據(jù)優(yōu)勢，又發(fā)表一篇硬剛新冠疫情的最新研究成果！這次的研究不單是有趣，還在科學疫情防控方面具有很高的應用價值。

引言

關注疫情動態(tài)的小伙伴都有所了解，面對疫情，目前有效的非藥物干預方案通常需要及時、準確地在城市中選擇一些高風險區(qū)域進行重點疫情防控，例如出行限制甚至病例隔離。對于高風險區(qū)域的預測，現(xiàn)有的研究工作主要將已確診病例的空間分布視為重要依據(jù)，其主要問題在于確診病例的統(tǒng)計數(shù)據(jù)往往粒度過粗且通常具有滯后性，同時，不少新冠病毒攜帶者在確診前就可能已經(jīng)將病毒傳播開了。

為了解決這些問題，百度的研究人員提出了一個名為C-Watcher的機器學習框架，旨在從新冠疫情重災區(qū)傳播到目標城市之前，預測出目標城市中每個社區(qū)的疫情感染風險。

首先，C-Watcher從百度地圖數(shù)據(jù)中抽取了多種特征來刻畫城市中的每個住宅小區(qū)。其次，為了在疫情爆發(fā)前將有助于識別風險的知識及時遷移到目標城市，研究人員提出了一個創(chuàng)新性的對抗編碼器框架，可以提取疫情重災區(qū)城市和目標城市之間的共性特征，并從中學習高風險社區(qū)的普遍特點。利用該方法從城市相關的特征中抽取有用信息，可以實現(xiàn)在目標城市進行早期高風險小區(qū)的高效預測?；趪鴥?nèi)COVID-19爆發(fā)早期的真實數(shù)據(jù)對C-Watcher進行評測后，實驗結(jié)果表明C-Watcher能夠在疫情早期有效地從大量住宅小區(qū)中成功篩查出高風險小區(qū)。該論文已入選人工智能領域頂級會議AAAI 2021，向國際同行分享科學抗疫最新研究成果。

▲圖1 C-Watcher 的使用場景

論文名稱：
C-Watcher: A Framework for Early Detection of High-Risk Neighborhoods Ahead of COVID-19 Outbreak

論文鏈接：
https://arxiv.org/abs/2012.12169

Arxiv訪問慢的小伙伴也可以在【夕小瑤的賣萌屋】訂閱號后臺回復關鍵詞【0205】下載論文PDF~

小區(qū)特征構(gòu)建

本文基于百度地圖數(shù)據(jù)抽取特征來描述住宅小區(qū)的社會經(jīng)濟情況、人口特點以及時空遷徙情況，主要包括POI半徑特征（POI Radius Features）、人口學特征（Demographic Features）和交通方式特征（Transportation-related Features）等。這里以POI半徑特征（POI Radius Features）為例做簡要介紹。

POI半徑特征主要反映一個住宅小區(qū)周邊的基礎設施情況，因為小區(qū)住戶感染新冠的風險與基礎設施水平具有緊密的聯(lián)系。如果周邊基礎設施不完備，住戶往往需要到更遠的地方以滿足日常生活基本需求；同時，基礎設施匱乏的小區(qū)往往物業(yè)管理不夠科學與精細，在科學疫情防控力度上存在較大差異，這都可能增加新冠傳播風險。作者構(gòu)建了15種POI半徑（如醫(yī)院半徑）來刻畫小區(qū)的基礎設施，每種POI半徑均定義為該小區(qū)到某種類別POI（如醫(yī)院）的最短直線距離，圖2（a）中示意了POI半徑特征的計算規(guī)則。

為了更直接地反映基礎設施的完備情況，作者還構(gòu)建了一個二值的基礎設施完備水平指標，將半徑1km內(nèi)同時含有醫(yī)院、學校、餐廳等多種基礎生活設施的小區(qū)視為基礎設施完備的小區(qū)，如圖2（b）所示。

文中對新冠爆發(fā)初期武漢市高/低風險小區(qū)的數(shù)據(jù)進行統(tǒng)計后，發(fā)現(xiàn)新冠風險確實與基礎設施存在較強的相關性。如圖2（c）所示，大部分高風險小區(qū)的基礎設施都不完備；與此相反，大部分低風險小區(qū)具有更為完備的基礎設施。

方法

圖3展示了在目標城市預測新冠高風險小區(qū)的城市遷移學習模型的總體框架。

▲圖3 城市遷移學習模型總覽

該模型是一個對抗編碼器-解碼器框架，能夠提取疫情重災區(qū)城市（epicenter city）和目標城市之間（target city）的共性特征，并依靠重災區(qū)城市的大量數(shù)據(jù)，從中學習高風險社區(qū)的普遍特點，再將這種共性的知識遷移到疫情尚未爆發(fā)的目標城市，實現(xiàn)早期的高風險小區(qū)預測。模型主要有兩部分組成：1）利用對抗學習框架提取城市間的共性特征；2）對表征空間進行約束，實現(xiàn)新冠高風險小區(qū)預測。

對抗學習框架

對抗學習框架由編碼器（encoder）和鑒別器（discriminator）構(gòu)成，如圖4所示：

▲圖4 對抗學習框架

Encoder將住宅小區(qū)的特征向量 n 作為輸入，具體地記 n^E 為epicenter cities中小區(qū)的特征向量，n^T 為target city中小區(qū)的特征向量，輸出編碼后的表征向量。通常來說，因為編碼后的表征向量來自于對不同城市的住宅小區(qū)的描述，它們的分布存在較大差異，這種差異使得encoder提取到高風險小區(qū)的特點可能僅適用于epicenter city，這阻礙了模型將epicenter cities中學到的經(jīng)驗遷移到target city。

為了解決這個問題，作者引入了discriminator來縮小編碼后表征向量在分布上的差異。Discriminator是一個分類器，它的作用是從Encoder輸出的表征中區(qū)分出樣本來自epicenter cities還是target city，即把編碼后的表征向量作為輸入，并完成一個二分類任務，將來自于epicenter cities的編碼表征向量，和來自于target city的編碼表征向量判定為不同的兩類。相反的是，encoder學習來自兩個不同城市樣本的共性特征，讓discriminator難以正確分類。

表征空間約束

在Adversarial Learning的框架中，Encoder僅僅能夠?qū)W到epicenter cities和target city中小區(qū)樣本的共性特征，為了提高新冠風險的識別能力，作者引入圖5中的模塊對表征空間進行約束，主要包括特征重構(gòu)和新冠高風險小區(qū)識別分類兩部分。

▲圖5 表征空間約束示

特征重構(gòu)部分包括Encoder以及兩個Decoder，兩個Decoder分別用于epicenter cities和target city中小區(qū)特征的重構(gòu)。將Encoder輸出的表征向量輸入Decoder，得到解碼后的表征向量，利用重構(gòu)損失函數(shù)優(yōu)化Encoder和Decoder，使得Decoder能夠從編碼后的表征中恢復出原始輸入，以保證Encoder學習到的表征仍然具有描述一個小區(qū)的信息，而不是單純地能夠在epicenter cities和target city中相似。

高風險小區(qū)識別分類的部分則有Encoder和Classifier組成。Classifier將epicenter cities小區(qū)的編碼表征向量作為輸入，利用epicenter cities中大量有標記樣本，讓Encoder從中提取能夠判斷新冠風險的特征。

“Reference city”驗證機制

由于C-Watcher的設計是為了在沒有爆發(fā)疫情的目標城市進行高風險小區(qū)的早期預測，為了避免將目標城市高風險小區(qū)的先驗信息引入模型的超參數(shù)中，作者提出了“reference city”驗證機制，為模型選擇合適的超參數(shù)。C-Watcher使用epicenter city的數(shù)據(jù)訓練模型，并將reference city的真值數(shù)據(jù)當作驗證集來選擇模型的超參數(shù)。在本文中，reference city是按照距離target city最近的城市作為標準來選取的。圖6對該驗證機制作了簡單介紹。

▲圖6 “Reference city“驗證機制

實驗分析

新冠高風險小區(qū)早期預測

作者收集了國內(nèi)新冠肺炎爆發(fā)初期16個城市的高風險小區(qū)數(shù)據(jù)對C-Watcher進行測試，其中包含重災區(qū)武漢市，5個參考城市和10個目標城市。C-Watcher在目標城市上的預測性能遠好于不采用城市遷移學習的機器學習模型。

▲表1 目標城市高風險小區(qū)預測性能對比

特征重要性分析

作者還采用Lasso Logistic Regression的方法，以各個特征系數(shù)的絕對值為依據(jù)，篩選出最重要的20個特征，如圖7所示。

▲圖7 Lasso系數(shù)最大的20個特征

從中我們可以獲得一些對新冠疫情防控具有指導意義的信息。比如，實驗結(jié)果表明，在POI半徑特征中，除了二值的基礎生活設施指數(shù)特征（P: PFLF & P: PRLF）與新冠風險顯著相關以外，距火車站遠（P: RTS）的住宅小區(qū)風險較低。

總結(jié)

本文提出了一個識別城市中新冠高風險小區(qū)的框架C-Watcher，它基于百度地圖數(shù)據(jù)提取了大量描述住宅小區(qū)的社會經(jīng)濟情況、人口特點以及時空遷徙情況等有助于識別新冠風險的特征，采用對抗學習的框架從重災區(qū)學習高風險小區(qū)的特點，并將這些知識遷移到未爆發(fā)疫情的目標城市，實現(xiàn)了在早期階段對潛在新冠高風險小區(qū)進行預測。

往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統(tǒng)計學習方法》的代碼復現(xiàn)專輯 AI基礎下載機器學習的數(shù)學基礎專輯本站qq群704220115，加入微信群請掃碼：

總結(jié)

以上是生活随笔為你收集整理的【论文解读】百度提出新冠高风险小区预警算法，AAAI21收录！的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Win7系统提示NVIDIA显示设置不可
下一篇：【机器学习基础】重磅发布！吴恩达 AI

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

ChatGpt

【论文解读】百度提出新冠高风险小区预警算法，AAAI21收录！

引言

小區(qū)特征構(gòu)建

方法

實驗分析

總結(jié)

總結(jié)