[NLP]AR模型与AE模型
生活随笔
收集整理的這篇文章主要介紹了
[NLP]AR模型与AE模型
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
AR語言模型(AutoRegressive LM):只能獲取單向信息,即只能前向讀取信息并預測t位置的單詞或者從后向讀取信息并預測t位置的單詞,卻不能同時獲取雙向信息,代表例子是GPT,GPT2,XLNet,ELMO
AR LM的優(yōu)點:比較擅長生成類任務
缺點:只能獲取單向信息,不能獲取雙向信息。
AE語言模型(AutoEncoder LM):獲取雙向信息進行預測,如想要預測位置t的單詞,既可以前向獲取信息也可以后向獲取信息,代表例子是Bert
AE LM的優(yōu)點:可以獲取雙向信息,能同時看到預測位置的上文和下文
缺點:如bert,它在預訓練過程中會增加輸入噪聲,如對輸入序列會隨機mask掉一部分的單詞,而在微調(diào)時卻不會增加輸入噪聲,這種預訓練-微調(diào)步驟中產(chǎn)生的差異,會產(chǎn)生一部分的人為誤差
總結(jié)
以上是生活随笔為你收集整理的[NLP]AR模型与AE模型的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CentOS的利手:“Screen”一个
- 下一篇: QML学习(五)——<TextIn