日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

谣言止于智者:基于深度强化学习的谣言早期检测模型

發布時間:2024/10/8 编程问答 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 谣言止于智者:基于深度强化学习的谣言早期检测模型 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.


「論文訪談間」是由 PaperWeekly 和中國中文信息學會社會媒體處理專委會(SMP)聯合發起的論文報道欄目,旨在讓國內優質論文得到更多關注和認可。

?



謠言一般是指未經核實的陳述或說明,它往往與某一事件相關,在大眾之間廣泛傳播。而隨著社交媒體的發展,謠言可以通過社交媒體以核裂變的方式快速傳播,這往往會引發諸多不安定因素,并對經濟和社會產生巨大的影響。


謠言從產生到傳播直至造成危害,往往會經歷一段時間的演化,在這期間會有大量的相關信息伴隨源信息而發布。圖 1 描述的是在 Twitter 上傳播的一則謠言——“一個 17 歲黑人小孩因偷竊糖果被警察擊斃”。


我們以源消息的發布作為時間原點,不難發現該信息一經發布便在 Twitter 上引發軒然大波,但遺憾的是,直至發布 24 小時后才有消息證實該信息為謠言。然而,此時該謠言已經在社交媒體上廣泛傳播,并造成不可挽回的影響。因此,本文旨在研究社交媒體中謠言的早期檢測。



謠言的早期檢測通常是指謠言剛產生的幾小時內,即謠言在這期間被發現,其可控性強,產生的危害性弱?,F有研究成果大多集中在如何更準確的進行謠言檢測,其往往忽視了謠言檢測的時效性需求。少數涉及早期謠言檢測的,也只是簡單比較不同靜態檢測點上的準確率,即僅用預先定義好的固定檢測點前的數據進行檢測,并比較準確率。


實際上,靜態檢測點并不是明智之舉,不同的謠言在社交媒體上的爆點時間并不相同,有些謠言會因為時間的設置過早而無法保證檢測準確率,有些謠言則會因為設置過晚而無法保證其檢測時效性。因此,謠言的判別應依照不同的事件,動態地設置檢測點,從而實現謠言的早期發現。


為了解決這一問題,本文提出了一個基于強化學習的謠言早期檢測模型,該模型將社交媒體中發布的帖子按其發布時間以信息流的形式進行輸入。每當一個新帖子到來,模型都會對其進行判別,并將判別結果輸入到強化學習模塊,強化學習模塊利用獎勵機制對當前檢測結果進行判斷,并根據準確率來進行策略選擇。如果準確率滿足要求,則輸出判別結果,否則繼續監聽。通過這種方式,不僅實現了謠言的早期發現,同時還能保證檢測的準確率。


模型


不失一般性,我們用E表示一個待檢測的事件,它往往有一系列相關的帖子構成,其中表示源信息,表示截至當前時間點最新發布的帖子。謠言早期判別模型的設計目標就是為了盡可能早的判別 E 是否是一個謠言。?


謠言早期判別模型(Early Rumor Detection,ERD)主要包括兩個部分:檢測點模塊(Checkpoint Module,CM)謠言檢測模塊(Rumor Detection Module,RDM)


其中謠言檢測模塊用于判別某一事件是否為謠言,而檢測點模塊用于判斷是否觸發 RDM。這里 CM 扮演了一個重要的角色,它用來決定何時對相關事件進行判別。該模型的創新之處在于利用強化學習方法來發現最優的檢測點,同時采用交替學習的方式優化兩個模塊,可以在保證準確率的前提下,盡早識別謠言。模型框架如下圖所示。



謠言檢測模塊


謠言檢測模塊主要用于檢測某事件是否為謠言。具體地,首先將待檢測的帖子序列進行分詞并以詞向量形式進行表示,同時使用全連接神經網絡和 maxpooling 運算提取每個帖子的特征。需要注意的是由于通常帖子量很大,連續的帖子會按照一定數量以帖子集合形式輸入。



其次,采用 GRU 循環神經網絡來學習帖子集合的序列特征。



最后,采用 softmax 輸出謠言檢測的結果。



檢測點模塊


與現有設置靜態檢查點的方法不同,CM 通過學習觸發 RDM 所需的帖子數量來確定檢測點,進而對相關事件進行謠言識別。為此,我們利用深層強化學習來確定最佳檢查點。我們以 RDM 的準確率作為獎勵,同時將不觸發 RDM 的次數作為懲罰。通過這種方式,CM 可以學習到如何在準確率和時效性之間進行權衡。


具體的,在強化學習模塊中,CM 將 GRU 中產生的隱藏狀態作為輸入,使用雙層前饋網絡計算 action-value 函數。為此,我們采用 Q-learning 方法來進行計算,action-value 的最優函數 Q* 可以定義為在狀態 s 下采取行動 a 以獲得最大的獎勵值 r。



其中 r 是獎勵值,γ 是 discount rate,選擇所有 action 序列中的最優值 a’,使之滿足期望最大化。?


在這個過程中,CM 會根據當前狀態,計算出不同 action 的獎勵估計值。



這里 action 集合主要包括繼續輸入待檢測帖子和停止謠言檢測,并以謠言檢測模塊給出的結果正確與否來計算實際獎勵值。



這里 M 是一個遞增的數,在每次判斷正確后,M 值都會累積遞增。-P 是一個固定的懲罰系數,-ε 是一個固定的微小懲罰系數,來促使檢測點模塊確定較早的檢測點。


聯合訓練


在模型訓練過程中,我們會一并訓練 RDM 以及 CM 模塊,其訓練過程類似于生成對抗網絡。具體的,我們會先預訓練謠言檢測模塊(RDM),使其達到一定的準確率,進而來評估檢測點模塊。


隨后,交替訓練兩個 CM 與 RDM 模型:檢測點模塊計算出來的新的檢測點會反饋給下一個謠言檢測模塊,即檢測點模塊以謠言檢測模塊評估的結果學習到好的檢測點,謠言檢測模塊適應新的檢測點以給出正確結果。


實驗結果


本文在兩個公開數據集上進行實驗來驗證模型的準確性和時效性,分別是基于微博和 Twitter 的謠言數據集,兩個數據集的相關統計指標請見表 1。



實驗中,我們首先對模型的準確性進行比較。與現有模型相比,我們的模型 RDM(僅謠言檢測模塊采用完整的信息)的準確率在兩個數據集上都更具優勢,如表 3、表 4 所示。此外,與現有最好的模型相比,ERD(結合了檢測點模塊并使用動態檢測點)也表現相當。




我們進一步對模型進行時效性驗證。由于當前謠言檢測方法中很少涉及時效性的實驗,我們主要和 GRU-2 模型進行比較。在 GRU-2 中,其采用了人為設置的靜態時間點方式,即事件發生后的第十二小時為檢測節點。


在實驗中,我們按照 6 小時作為一個時間間隔對其進行劃分,將全部消息按照時間劃分為 8 個間隔。圖 6 展示的是不同時間間隔的謠言識別百分比,圖 7 顯示的是在各個時間間隔中的謠言識別準確率。



圖 6 和圖 7 中的虛線分別表示 GRU-2 在 12 小時靜態檢測點上的判別結果。ERD 模型可以在 6 小時內識別出大部分事件,其遠遠早于 12 小時(實驗中微博檢測點平均為 7.5 小時,Twitter 平均為 3.4 小時)。不僅如此,圖 7 顯示相較于 GRU-2,ERD 模型在各個時間間隔的準確率更高。


此外,為了驗證 CM 的有效性,我們將 ERD 和 RDM 做了比較,結果如圖 8 所示。其中 RDM 采用了設定靜態檢測點的方法,可見在微博數據集上 ERD 僅 7.5 小時的結果就與 RDM 在 24 小時的準確率相當,而在 Twitter 上 ERD 更是能夠提前近 20 小時達到與 RDM 相當的準確率。




表 3 是本文對 PARL 模型做的消融實驗的結果,可以觀察到:每個組件層都對提升分數預測的精度起到了正面的影響。



為了進一步對方法進行定性分析,我們在表 5 中展示了一個來自微博謠言事件的例子。謠言始于 2012 年 8 月 18 日發布的消息,聲稱大閘蟹含有有害激素和毒素。在發布后的 12 小時內,230 萬用戶通過轉發、評論或質疑原文的方式參與了消息的散播。此謠言迅速蔓延,并對中國水產養殖業造成重大經濟損失。在 24 小時后,謠言被正式駁回,但從表 5 中我們可以看到,ERD 在 34 分鐘內就檢測到謠言。


總結


本文提出了一種基于深度強化學習的早期謠言檢測模型 ERD。與之前設置靜態檢測點的方法不同,ERD 可以通過強化學習的方法來動態設定檢測點,以最少的信息來進行判別,進而實現謠言的早期發現。


我們分別在 Twitter 以及微博數據集中進行實驗驗證,ERD 可以分別用 3.4 小時以及 7.5 小時進行謠言的判別,與之前 12 小時相比大大提前了。同時 ERD 可以取得 93.3% 以及 85.8% 的準確率,與當前最優模型水平相當。


以下是相關數據集鏈接:


微博數據集:

http://alt.qcri.org/~wgao/data/rumdect.zip


Twitter數據集:

https://figshare.com/articles/PHEME_dataset_of_rumours_and_non-rumours/4010619



關于作者




周凱敏,畢業于國際關系學院,師從李斌陽副教授。主要研究文本不確定性識別,社交媒體中的謠言檢測和用戶意圖識別等。原就職于義語智能科技(上海)有限公司,本文即主要于公司實習期間,在學校和公司大力支持下所完成的。



舒暢,義語智能CTO & CEO。英國諾丁漢大學人工智能博士,英國布里斯托大學機器學習碩士,獲北京航空航天大學、英國赫爾大學雙學士,師從國際機器學習泰斗級教授Nello Cristianini。曾在日本國立情報研究所(NII)擔任訪問研究員,廣州市高端人才,現擔任中科院計算所上海分所&義語智能人工智能自然語言處理聯合實驗室主任,中國中文信息學會青年工作委員會委員之一,社交媒體處理委員之一。在COLING,NAACL等頂尖國際會議和雜志期刊上發表過多篇論文,在國內擁有多項人工智能相關專利。



李斌陽,國際關系學院副教授,碩導。研究興趣包括自然語言處理、情感分析和社會計算,累計發表論文50余篇。擔任中國中文信息學會社交媒體專委會副秘書長、青年工作委員會委員,人工智能學會青工委委員。長期擔任相關領域國際權威學術期刊審稿人和重要學術會議程序委員會委員(TPC)。曾獲教育部科技進步二等獎(第三完成人),香港科技資訊優秀獎。



劉杰漢,博士,DeepBrain義語智能首席科學家。主要研究方向為NLP和主題模型,英國倫敦國王學院博士后,澳大利亞墨爾本大學機器學習博士及學士,現任澳大利亞墨爾本大學人工智能導師,曾在IBM澳大利亞研究院擔任高級研究員,在日本國立情報研究所(NII)擔任訪問研究員。在ACL,COLING,NAACL,EMNLP等頂尖自然語言處理國際會議和雜志期刊上共發表論文近40篇,在國內及國外擁有多項人工智能相關專利。


主辦單位









點擊以下標題查看更多往期內容:?


  • 目標檢測小tricks之樣本不均衡處理

  • 圖神經網絡綜述:模型與應用

  • 推薦系統閱讀清單:最近我們在讀哪些論文?

  • 小樣本學習(Few-shot Learning)綜述

  • 萬字綜述之生成對抗網絡(GAN)

  • 基于深度學習的推薦模型—PARL

  • 基于雙層注意力機制的異質圖深度神經網絡

  • 基于小樣本學習的意圖識別冷啟動




#投 稿 通 道#

?讓你的論文被更多人看到?



如何才能讓更多的優質內容以更短路徑到達讀者群體,縮短讀者尋找優質內容的成本呢?答案就是:你不認識的人。


總有一些你不認識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋梁,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發出更多的可能性。


PaperWeekly 鼓勵高校實驗室或個人,在我們的平臺上分享各類優質內容,可以是最新論文解讀,也可以是學習心得技術干貨。我們的目的只有一個,讓知識真正流動起來。


??來稿標準:

? 稿件確系個人原創作品,來稿需注明作者個人信息(姓名+學校/工作單位+學歷/職位+研究方向)?

? 如果文章并非首發,請在投稿時提醒并附上所有已發布鏈接?

? PaperWeekly 默認每篇文章都是首發,均會添加“原創”標志


? 投稿郵箱:

? 投稿郵箱:hr@paperweekly.site?

? 所有文章配圖,請單獨在附件中發送?

? 請留下即時聯系方式(微信或手機),以便我們在編輯發布時和作者溝通




?


現在,在「知乎」也能找到我們了

進入知乎首頁搜索「PaperWeekly」

點擊「關注」訂閱我們的專欄吧



關于PaperWeekly


PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。


▽ 點擊 |?閱讀原文?| 獲取最新論文推薦

總結

以上是生活随笔為你收集整理的谣言止于智者:基于深度强化学习的谣言早期检测模型的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。