日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人工智能 > ChatGpt >内容正文

ChatGpt

5 篇 AAAI 2018 论文看「应答生成」

發布時間:2024/10/8 ChatGpt 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 5 篇 AAAI 2018 论文看「应答生成」 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.


作者丨李軍毅

學校 | 中國人民大學本科生

研究方向丨機器學習、自然語言處理


前言


本文將介紹 AAAI 2018 中的五篇關于應答生成方面的論文,希望對大家有所啟發。



寫作動機


作者認為,雖然之前的論文對多輪對話的層次結構進行了建模,知道應答的生成應該考慮到上下文(context)信息,但是卻忽略了一個重要的事實,就是上下文中的句子(utterance)和單詞(word)對應答有著不同分量的影響


所以,作者提出了一種層次化的注意力機制來對多輪對話中不同層面的影響進行刻畫,分別是句子級注意力機制(utterance level attention)單詞級注意力機制(word level attention)


具體模型



問題定義:數據集表示上下文(context),每一個表示一個句子,表示第 k 個單詞,表示應答。


Word Level Encoder


對于一個,論文使用雙向 GRU 將每個 ui 編碼為,每個和分別表示 GRU 前向和后向的隱藏狀態。


Word Level Attention


于表示 Decoder 第 t 步時,關于 ui 的 context vector。至于如何計算,后面介紹。


Utterance Level Encoder


將作為 GRU 的輸入,計算


Utterance Level Attention


表示 Decoder 在第 t 步時,關于整個 U 的 context vector。至于如何計算,后面介紹。


與傳統的 attention 機制不同,word level attention 不僅依賴 decoder,還依賴 utterance level encoder。所以:



表示 Decoder 前一個狀態,表示 utterance level encoder 前一個狀態,表示 word level encoder 當前狀態。同理:






寫作動機


作者認為,在基于檢索的應答生成場景中,加入社會常識可以改善檢索結果的質量


具體模型



上圖表示一個常識庫。它是一個語義網絡,concept 是它的節點,relation 是它的邊,三元組 <concept1,relation,concept2> 稱為一個 assertion 。


問題定義


x 是一個message(context), [y1,y2,...,yK]∈Y 是一個應答候選集。


基于檢索的應答生成系統就是要選出最合適的,其中 f(x,y) 是衡量 x 和 y 之間的“相容性”的函數。



那么,如何將常識庫融入我們的問題定義中呢??


以上圖為例。首先,事先定義好一個 Assertion={c:<c1,relation,c2>} 詞典,它的 key 是 concept c ,value 是三元組 assertion <c1,relation,c2> ,其中 c=c1 或者 c=c2 。


然后,論文里又定義一個 Ax ,表示所有與 message(context)x 有關的 assertion 三元組。


這個 Ax 的建立規則是:對 message 文本 取 n-gram(所有uni-gram,bi-gram,...,n-gram)短語,然后從 Assertion 詞典選取那些與 n-gram 短語匹配的 key 所對應的 value,加入到 Ax 中。


至此,我們就得到了所有與 message 有關的常識。



Dual-LSTM Encoder


上圖中下面的方框。利用 LSTM 結構對 message x 和 response y 進行編碼,得到向量,計算兩者之間的“相容性”。


Tri-LSTM Encoder


上圖中上面的方框。因為 c1 和 c2 都有可能是幾個單詞通過下劃線連在一起的concept,所以我們將 c1 拆成 [c11,c12,c13,...] , c2 拆成 [c21,c22,c23,...] ,至于為什么不拆 relation?因為 concept 是由多個常見詞連接起來的單詞,如果將這個合成詞直接作為詞典中的單詞,那么詞典將會很大,而 relation 則沒有幾種。


最終,三元組 <c1,r,c2> 將變為 [c11,c12,c13,...,r,c21,c22,c23,...] 的序列,我們對每個 assertion 序列利用 LSTM 進行編碼,得到向量,然后,我們取 response 與所有常識“相容性”最大的值。?


最后,將兩個 Encoder 的“相容性”值加起來,最終選擇總和最大的 response。





寫作動機


作者認為,以前的生成模型在生成單詞時,模型需要遍歷整個詞典。如果詞典非常大,那么每次遍歷都非常耗時。所以,作者提出,每次生成單詞時,都可以根據輸入的情況靈活地選擇需要遍歷的詞典的大小以及它里面的詞,這樣將可以節省大量時間。


具體模型


問題定義


數據集, Xi 表示 message, Yi 表示 response,生成 Ti 的目標詞典為, |V| 表示詞典的大小,,0 表示單詞不在詞典中,1 表示單詞在詞典中。?


Ti 是從多元伯努利分布中隨機采樣得到,



那么又是怎么得到呢?


如上圖,在詞典 V 中,單詞可以分為兩類:function words 和 content words。


其中,function words 出現 10 次以上,除了名詞、動詞、形容詞、副詞,它們保證了 response 的語法正確性和流暢性,在每個 response 中都可能出現,所以,這些單詞的, I(c) 是這些單詞的索引;content words 則是詞典中其他的詞,它們的


最后,根據得到的多元伯努利分布隨機采樣得到 Ti ,進而得到目標詞典。得到詞典后,剩下的過程則和以前傳統的過程類似了。





寫作動機


這篇論文解決的問題是,基于檢索的應答生成場景下如何從候選應答集選擇合適應答的難題。論文使用的方法是多臂老虎機模型


多臂老虎機模型


一個賭徒,要去搖老虎機,走進賭場一看,一排老虎機,外表一模一樣,但是每個老虎機吐錢的概率不一樣,他不知道每個老虎機吐錢的概率分布是什么,那么想最大化收益該怎么辦?這就是多臂賭博機問題(Multi-armed bandit problem, K-armed bandit problem, MAB)。?


如何解決呢?論文中使用的是湯普森抽樣方法。?


假設每個臂產生收益的概率為 p,我們不斷地試驗,去估計出一個置信度較高的*概率p的概率分布*就能近似解決這個問題了。?


怎么估計概率 p 的概率分布呢? 假設概率 p 的概率分布符合 beta (wins, lose) 分布,它有兩個參數:wins,lose。?


每個臂都維護一個 beta 分布的參數。每次試驗后,選中一個臂,搖一下,有收益則該臂的 wins 增加 1,否則該臂的 lose 增加 1。?


每次選擇臂的方式是:用每個臂現有的 beta 分布產生一個隨機數 b,選擇所有臂產生的隨機數中最大的那個臂去搖。


具體模型



如上圖,左邊是 context,使用雙向 LSTM 編碼, ci 表示 context 向量,等于所有單詞向量的平均和。右邊是 response,也使用雙向 LSTM 編碼, uj 表示 response 向量,等于所有單詞向量的平均和。如果是傳統的離線學習過程,那么訓練過程應該為:



對損失做反向傳播即可。


但本文解決的是在線學習場景,模型隨機選擇一個 context,然后檢索到一個 response,用戶對這個選擇做出打分,正確則 reward=1,錯誤則 reward=0。然后,作者企圖利用線性邏輯回歸湯普森采樣對 reward 進行擬合,





寫作動機


作者覺得,生成 response 時應該生成多種 style 的 response,所以,作者提出了一種 Elastic Responding Machine (ERM) 模型,生成多種類型的 response。


具體模型


  • Encoder-Decoder

  • Encoder-Diverter-Decoder



這個模型來自 Zhou et al. 2017 的 Mechanism-Aware Neural Machine for Dialogue Response Generation表示 M 個 mechanism 的集合,mechanism 可以理解為 style。


Diverter 的作用是選出最適合 context c 的 mechanism,通過公式:



選擇評分最高的 mechanism,最終生成 response y 的概率為:



  • Encoder-Diverter-Filter-Decoder



本文作者在前文的基礎上,又加入了 Filter 模塊,作者的目的是從所有 mechanism 集合中選出一個子集 Sx ,包含足夠多的 mechanism,能夠生成多種 style 的 response。


這個子集 Sx 需要滿足兩個條件:1)包含足夠多的 mechanism;2)子集的 mechanism 沒有太高的重復性,沒有冗余。選中了子集 Sx 后,生成 response y 的概率為:



那么,怎么選擇子集 Sx 呢?論文使用的是強化學習的方法


Action:at 表示停止動作, ac 表示繼續動作;


State:表示子集中包含 top k 個 mechanism 的狀態;


Policy:,m0 表示停止的 mechanism;


Reward:作者認為,如果子集沒有達到要求的 K 個 mechanism 的規模,則沒有獎勵。



選出包含 K 個 mechanism 之后,依次將 c 和 mi (mi∈Sx) 連接在一起輸入到 decoder 中生成各自 mechanism 對應的 response。下面是具體的算法流程:




點擊以下標題查看其他文章:?


  • 自適應注意力機制在Image Caption中的應用

  • CVPR 2018值得一看的25篇論文,都在這里了

  • 進擊的YOLOv3,目標檢測網絡的巔峰之作

  • Wasserstein距離在生成模型中的應用

  • 深度學習在CTR預估中的應用


?戳我查看比賽詳情


#作 者 招 募#


讓你的文字被很多很多人看到,喜歡我們不如加入我們




關于PaperWeekly


PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。


▽ 點擊 |?閱讀原文?| 進入作者知乎專欄

總結

以上是生活随笔為你收集整理的5 篇 AAAI 2018 论文看「应答生成」的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 男生尿隔着内裤呲出来视频 | 精品亚洲永久免费精品 | 手机版av| 久久久99精品 | 毛片亚洲av无码精品国产午夜 | 久久婷综合 | 日韩爽爽视频 | 欧美黄色短片 | 99久久国产综合 | 日本白嫩的bbw | 日韩精品一区二区三区中文在线 | 亚洲在线资源 | 欧美黄色高清视频 | 久久一级黄色片 | 91人人澡人人爽人人精品 | 性猛交富婆╳xxx乱大交天津 | 欧美视频一二三区 | 国产精品无套 | 三级在线网站 | 成人免费公开视频 | 轻轻色在线观看 | 成人三级在线看 | 乱子伦视频在线看 | 电影《走路上学》免费 | 在线观看91视频 | 日韩国产第一页 | 国产乱淫片视频 | 日本久久久久久久久 | 欧美美女在线观看 | 亚洲美女视频 | 亚洲成人黄色av | 激情六月综合 | 国产精品毛片一区视频播 | 欧美碰碰碰 | 免费色网站 | 国产高清在线不卡 | 狠狠撸视频 | 视频一区在线免费观看 | 天堂中文在线资 | www.99av| 日本一区二区在线 | 最近日本中文字幕 | 女性喷水视频 | 亚洲色婷婷一区二区三区 | 午夜黄色网 | 国产一级大片在线观看 | 狠狠躁日日躁夜夜躁2022麻豆 | 国产一级片网址 | 久久艹中文字幕 | 台湾a级片| 麻豆资源 | 免费高清欧美大片在线观看 | 亚洲精品电影网 | 亚洲天堂网站在线 | 人成在线观看 | 日韩电影中文字幕 | 日韩精品在线视频观看 | 中国丰满熟妇xxxx性 | 日本少妇在线观看 | 综合av在线| 亚洲欧美日韩成人 | 91直接进入| 一区二区成人av | 上海毛片 | 日韩视频免费在线播放 | 亚洲精品电影在线观看 | 国产山村乱淫老妇女视频 | 超碰美女| 国产三级91 | 134vcc影院免费观看 | 日本三区视频 | 精品视频网 | 肉嫁高柳在线 | 午夜老司机福利 | 亚洲狠狠丁香婷婷综合久久久 | 黄色爱爱视频 | 女性裸体下面张开 | 极品一区| 91极品在线| 精品国产一区二区三区av性色 | 免费黄色成人 | 国产一区二区精彩视频 | 男人天堂成人网 | 欧美91看片特黄aaaa | 久久成人在线视频 | 夜夜草视频 | 69精品久久久 | 天堂网色 | 一级女性全黄久久生活片免费 | www欧美com| 久草成人在线 | 亚洲国产精品久久久久婷婷老年 | 日本人の夫妇交换 | 日本激情视频 | 一级大片视频 | 成人精品免费网站 | 丁香六月在线 | 97人妻人人澡人人爽人人精品 | 天码人妻一区二区三区在线看 |