日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【NLP】NLP文本风格迁移,秒变金庸风

發布時間:2025/3/12 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【NLP】NLP文本风格迁移,秒变金庸风 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

NewBeeNLP公眾號原創出品??

公眾號專欄作者@山竹小果

風格遷移是自然語言生成領域一個非常火的主題,對于文本風格遷移,先舉個例子:

Input:謝謝
Output(金庸):多謝之至

Input:再見
Output(金庸):別過!

Input:請問您貴性?
Output(金庸):請教閣下尊姓大名?

再潑個冷水:

目前自然語言生成(NLG)領域的研究還不太實用,所以希望像人一樣先理解句子,再改寫句子是不太現實的。

那么能否用機器翻譯的方法,不理解句子也能實現句子的轉換?這也是挺有局限的。機器翻譯需要使用使用大量的對齊語料進行監督學習,應該是不會有人專門標注這樣的語料的。

不過在某些特定領域,可以通過一些巧妙的數據挖掘方式來獲取語料。例如根據新聞報道自動生成評論或摘要等,這樣的題目現在很多人在做。假如把新聞語料和新聞評論的關系也當做“風格轉換”的話,那么答案還是存在的。

相關工作 接下來我們看一些文本風格遷移的工作,我們關心的:

  • 文本風格轉換是否可行?

  • 用的什么方法?生成 or 翻譯?

  • 評價標準?

  • 論文 LIST

  • Unpaired Sentiment-to-Sentiment Translation: A Cycled Reinforcement Learning Approach

  • Delete, Retrieve, Generate: A Simple Approach to Sentiment and Style Transfer

  • Generating Sentences by Editing Prototypes

  • Style Transfer from Non-Parallel Text by Cross-Alignment

  • Style Transfer Through Back-Translation

  • A Dual Reinforcement Learning Framework for Unsupervised Text Style Transfer

  • A Hierarchical Reinforced Sequence Operation Method for Unsupervised Text Style Transfer

  • 下面簡單看下前三篇:

    Unpaired Sentiment-to-Sentiment Translation: A Cycled Reinforcement Learning Approach

    第一篇工作,從題目來看就很吸引人,unpaired 對應 cycle,很自然聯想到 reconstruction。而 reinforcement learning 主要是為了解決訓練過程中離散文本不可求導的問題。

    雖然過去也有一些 text style transfer 的問題,但是因為缺少對于非 stylish 或者說“普通文本”的語義信息的顯式保留,導致很容易出現下面這種情況:當把“The food is delicious”這句話從正向情感遷移到負向情感時,會得到“What a bad movie”——雖然情感被正確轉化了,但是內容的主體也跟著變了。這顯然是不好的。

    為了解決這個問題,這篇工作使用了兩個 module,一個 neutralization module 用于提取 non-emotional content,另一個 emotionalization module 用于生成或者說融入 sentiment words。

    如上圖所示,下面的 neutralization module 其實是通過直接刪除emotional words 來實現 non-emotional content 的保留。這一步中,作者通過使用 self-attention 得到的注意力權重作為分類器特征,從而自動找出 emotional words。

    從實驗結果來看,這個方法的分類準確率也可以達到 90% 左右(不過 sentiment classification 本身也不是很難,稍微復雜一點的模型都可以達到95%甚至更高)。

    接下來就是 emotionalization module,可以看到,一個 encoder 和兩個 decoder。兩個 decoder 對應 sentiment classification 的兩個類別(positive or negative),并且分別用于訓練時的 reconstruction 和測試時的 generation(emotionalization)。

    由于文本的離散性,作者采用了 RL 的方法來訓練這兩個 module。RL 成功與否嚴重依賴于獎勵函數的設計。在這篇論文中,作者提出了兩個 reward:sentiment confidence 和 BLEU。尤其是 BLEU,主要是針對作者想解決的問題——non-emotional content perserving。最終的獎勵函數如下:

    插播:BLEU(Bilingual Evaluation Understudy)

    其中,

    這里的BLEU值是針對一條翻譯(一個樣本)來說的。例子:

    候選譯文(Predicted):It is a guide to action which ensures that the military always obeys the commands of the party

    參考譯文(Gold Standard) 1:It is a guide to action that ensures that the military will forever heed Party commands
    2:It is the guiding principle which guarantees the military forces always being under the command of the Party
    3:It is the practical guide for the army always to heed the directions of the party

    Modified n-gram Precision計算也即Pn):

    這里n取值為4,也就是從1-gram計算到4-gram。

    首先統計候選譯文里每個詞出現的次數,然后統計每個詞在參考譯文中出現的次數,Max表示3個參考譯文中的最大值,Min表示候選譯文和參考譯文中的最大值的最小值。例如,詞"the":然后將每個詞的Min值相加,將候選譯文每個詞出現的次數相加,然后兩值相除即得

    類似得到2-gram 3-gram 4-gram的Pn,例如"ensures that":然后我們取????1=????2=????3=????4=0.25,也就是Uniform Weights。得到:

    下面計算BP(Brevity Penalty),翻譯過來就是“過短懲罰”。由BP的公式可知取值范圍是(0,1],候選句子越短,越接近0。

    候選翻譯句子長度為18,參考翻譯分別為:16,18,16。所以????=18(候選翻譯句子長度),????=18(參考翻譯中選取長度最接近候選翻譯的作為r)

    所以

    整合:

    ????????????????=1?????????????(?0.684055269517)=0.504566684006

    BLEU的取值范圍是[0,1],0最差,1最好。通過計算過程,我們可以看到,BLEU值其實也就是“改進版的n-gram”加上“過短懲罰因子”。

    從實驗結果來看,過去的工作主要都只考慮了 style transfer 的成功與否(sentiment accuracy),而沒有顯性地考慮 content perserving,所以確實在 BLEU 指標下表現很差。

    但是也可以看到,這篇工作提出的方法在大幅提高 BLEU 的情況下,ACC 也有一定損失。可以從這個結果看到,想要非常自然地融入 sentiment words 并且不破壞語義和語法,是很困難的事情。看一些直觀的轉換結果:

    2. Delete, Retrieve, Generate: A Simple Approach to Sentiment and Style Transfer

    第二篇論文,幾乎也是一樣的思路。但是在具體實現上要更直接一點。第二篇論文在進行 style transfer 的時候,基于的是這樣的假設:文本的一些屬性(attribute),比如文本傳達出來的情感信息等,可以體現在文本中的某些特定詞匯上。通過改變這些詞匯,就可能直接改變整句文本的性質屬性(value)。

    由上面的示意圖可以看出,作者將那些具有指示功能的特定詞稱為 attribute marker,通過(主要)改變這些 marker,進行 attribute transfer。文章進一步提出了4種具體的方法來改變 marker。

    這4種具體的方式也由上圖很清晰地展示了出來。值得一提的是 DeleteOnly 和 DeleteAndRetrieve。在刪除了具體的 marker 后,作者提出再去根據這個沒有情感特定性的句子去從數據中檢索出一句最相似但是 attribute 的數值相反(target attribute)的話。檢索出的這句話主要用于提取新的 target attribute marker,作為“重寫” RNN 的輸入之一。

    很明顯,這樣的工作可能有一定局限性,但在一些簡化場景中,卻是更可控的。其實驗結果也印證了這點。

    3. Generating Sentences by Editing Prototypes

    上面兩篇工作都是進行風格轉換,而在進行文本改寫的時候,還有一類常見的場景就是進行非情感類改寫,比如擴寫句子,改寫語法錯誤等。在進行這樣的工作時,其實也可以采用類似的思路。先找到一個“中立”的、“簡單”的“模板”,再在這個基礎上加入希望增加的信息,如情感、一些復雜修飾詞等等。今天要分享的最后一篇工作就是這樣一個思路。

    從上面的示意圖中可以看到,修改后的句子增加了“modiocre”和“ridiculous”這兩個形容詞,變得更復雜了。而重中之重就是在學習 edit vector 上。

    可以看到,此時的 edit vector 不再是 sentiment words,而是一種 semantic operation。如果讓 edit vector 作為一種隱變量,也遵循某種分布,那么同樣的 edit vector 應該符合同一種 edit operation,并且對于句子的改寫是一種微小的可控的操作。

    基于這樣的假設和期望,作者用 VAE 來建模 z,目標函數如下:

    關鍵就是如何保證學到好的 p 和 q。這篇論文使用的方式和過去很多 VAE 的文本應用都不太一樣,有興趣的同學請一定去查閱原文。值得一提的是,這篇工作中的 edit vector z 是直接拼接在給 decoder 的每一個時刻的輸入上的,并沒有額外的 gate 或者 transform。這也是和上面兩篇工作的區別之一。

    最后從結果來看,作者提出的方法確實能更自然地改寫句子。這點從 case studies 還有句子的平滑度方面可以看出:

    Summary

    目前的方法大概就是深度學習在外加使用policy gradient的方法,對于文本的生成的損失函數只論詞的生成概率,可添加語言規則的損失項,類似詞性,情感等之類,可以提升,而后在beam search階段也可添加語言規則,而不是以只關注概率。

    另則,現在的文本風格遷移在人類的角度來看過于easy,離我們想象中的文本風格遷移還有很大一段距離。

    往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯 獲取本站知識星球優惠券,復制鏈接直接打開: https://t.zsxq.com/qFiUFMV 本站qq群704220115。加入微信群請掃碼:

    總結

    以上是生活随笔為你收集整理的【NLP】NLP文本风格迁移,秒变金庸风的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 蜜桃无码一区二区三区 | 国产精品人成 | 日韩电影一区二区 | 精品国产一区二区三区久久 | 欧美日韩激情在线 | 天天干夜夜玩 | www欧美com| 亚洲高清视频一区 | 天天干中文字幕 | 亚洲午夜视频在线 | 羞羞涩| 一区二区高清视频 | av在线播放免费 | 最近高清中文在线字幕在线观看 | 99国产精品99久久久久久粉嫩 | 97视频总站 | 狠狠干天天射 | 欧美视频网址 | 性av网 | 日本久久片 | 人人草人 | 欧美一性一乱一交一视频 | 欧美一区二区三区影院 | 国产一级免费视频 | 国产精品传媒在线 | 人人爱爱| 亚洲欧洲中文字幕 | 黄网站在线观看视频 | 中出在线视频 | 女性爱爱视频 | 国产一区二区三区在线播放无 | 91麻豆精品国产理伦片在线观看 | 婷婷影院在线观看 | 丁香六月av | a天堂视频在线观看 | 成人av免费网址 | 制服丝袜在线第一页 | 成人高清视频在线观看 | caoporen在线| 91看片在线看| 操少妇视频 | 饥渴少妇色诱水电工 | 伊人av一区| 日韩影院一区 | 奇米第四色7777 | 精品在线99 | av资源在线免费观看 | 欧洲精品免费一区二区三区 | 国产制服av | 国产主播中文字幕 | 色婷婷精品| 国产区精品在线观看 | 少女逼逼| 一级久久久久 | 在线观看中文字幕视频 | 麻豆福利影院 | 久久中文字幕一区 | 青青草十七色 | 亚洲美女视频在线 | 国产精品30p | 久久九九免费 | 国产久视频| 国产大学生视频 | av黄色在线免费观看 | 免费成人一级片 | 天天干免费视频 | 日本九九视频 | 国产精品成人网站 | 中文理论片 | 一本色道久久88 | 国产一区美女 | 天天插天天干天天操 | 国产高潮久久久 | 神马老子午夜 | 中文字幕人妻一区二 | 色狠狠综合 | 亚洲天堂国产精品 | 色女综合 | 婷婷一区二区三区 | 天堂成人国产精品一区 | 色一情一乱一伦一区二区三区 | 五月天视频 | 国产亚洲欧美日韩精品一区二区三区 | 亚洲天堂欧美 | 欧美激情免费观看 | 爱福利视频一区 | 中文字幕欧美专区 | 69sex久久精品国产麻豆 | 天堂俺去俺来也www 欧美大片在线播放 | 国产精品久久久久久久久久久久久久久久久久 | 麻豆导航 | 国产麻豆精品在线 | 人人草人 | av在线资源站 | 91国内在线视频 | 国产伦精品一区二区三区视频黑人 | 国产中文久久 | 国产精品一区二区久久 | 牛牛电影国产一区二区 |