直播 | AAAI 2021:文本对抗攻防中的对抗训练方法
「AI Drive」是由 PaperWeekly 和 biendata 共同發(fā)起的學(xué)術(shù)直播間,旨在幫助更多的青年學(xué)者宣傳其最新科研成果。我們一直認(rèn)為,單向地輸出知識并不是一個最好的方式,而有效地反饋和交流可能會讓知識的傳播更加有意義,從而產(chǎn)生更大的價值。
本期 AI Drive,我們邀請到華中科技大學(xué)計算機(jī)學(xué)院碩士生王曉森,為大家解讀其發(fā)表于 AAAI 2021?的最新工作。對本期主題感興趣的小伙伴,1 月 12 日(周二)晚 7 點(diǎn),我們準(zhǔn)時相約 PaperWeekly B 站直播間。
直播信息
深度模型對抗樣本最先在圖像分類任務(wù)中提出,即通過微小擾動使得神經(jīng)網(wǎng)絡(luò)產(chǎn)生錯誤輸出。近幾年來,研究者發(fā)現(xiàn)自然語言處理模型中同樣存在對抗樣本,并提出一系列的對抗攻擊和防御方法。但是由于文本的離散性和語義約束,在圖像對抗攻防中被廣泛使用的梯度信息和對抗訓(xùn)練防御方法一直未能有效地在基于近義詞替換的文本對抗中使用。
本篇工作針對文本分類模型進(jìn)行研究,提出了:?
1. 快速梯度投影攻擊:通過投影方式將梯度引入到基于同義詞替換的文本對抗攻擊,在保證現(xiàn)有攻擊成功率的前提下,速度比目前最快的攻擊提升了至少 20 倍;
2. 基于快速梯度投影攻擊的對抗訓(xùn)練:由于快速梯度投影攻擊的高效性,我們利用其實(shí)現(xiàn)了對抗訓(xùn)練,顯著地提升了深度模型的魯棒性。?
代碼和模型公開于:
https://github.com/JHL-HUST/FGPM
本次分享的具體內(nèi)容有:?
文本對抗攻防現(xiàn)狀
快速梯度投影算法
基于快速梯度投影攻擊的對抗訓(xùn)練
實(shí)驗(yàn)結(jié)果和分析
嘉賓介紹
?王曉森?/?華中科技大學(xué)碩士生?
王曉森,華中科技大學(xué)計算機(jī)學(xué)院 2019 級碩士生,師從何琨教授,主要關(guān)注深度學(xué)習(xí)的對抗樣本。
直播地址?& 交流群
本次直播將在 PaperWeekly B 站直播間進(jìn)行,掃描下方海報二維碼或點(diǎn)擊閱讀原文即可免費(fèi)觀看。線上分享結(jié)束后,嘉賓還將在直播交流群內(nèi)實(shí)時 QA,在 PaperWeekly 微信公眾號后臺回復(fù)「AI Drive」,即可獲取入群通道。
B 站直播間:
https://live.bilibili.com/14884511
合作伙伴
????
現(xiàn)在,在「知乎」也能找到我們了
進(jìn)入知乎首頁搜索「PaperWeekly」
點(diǎn)擊「關(guān)注」訂閱我們的專欄吧
關(guān)于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學(xué)術(shù)平臺。如果你研究或從事 AI 領(lǐng)域,歡迎在公眾號后臺點(diǎn)擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
總結(jié)
以上是生活随笔為你收集整理的直播 | AAAI 2021:文本对抗攻防中的对抗训练方法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: OpenViDial:一个大规模多模态对
- 下一篇: pay类消费是什么