日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【NLP】GPT:第一个引入Transformer的预训练模型

發(fā)布時間:2025/3/20 编程问答 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【NLP】GPT:第一个引入Transformer的预训练模型 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

目前兩種最重要的預(yù)訓(xùn)練語言模型,一種是前面介紹過的BERT,另外一種就是GPT。

GPT出了兩個版本,GPT1.0和GPT2.0,GPT2.0相對于GPT1.0差別不大,可以認(rèn)為是它的增強(qiáng)版。本篇介紹GPT1.0和GPT2.0,看看它于BERT有什么不一樣。

作者&編輯 | 小Dream哥

1 GPT是什么

General Pre-Training(GPT),即通用預(yù)訓(xùn)練語言模型,是一種利用Transformer作為特征抽取器,基于語言模型進(jìn)行訓(xùn)練的預(yù)訓(xùn)練語言模型。?

所以,理解GPT主要熟悉兩個方面即可,即語言模型和其由Transformer組成的結(jié)構(gòu)。

2 語言模型

一個語言模型通常構(gòu)建為一句話的概率分布p(W),這里的p(W)實(shí)際上反映的是W作為一個句子出現(xiàn)的概率。?說成大白話,語言模型就是計算某個句子出現(xiàn)的概率。


?對于一個由T個詞按順序構(gòu)成的句子,P(W)實(shí)際上求解的是字符串的聯(lián)合概率,利用貝葉斯公式,鏈?zhǔn)椒纸馊缦?#xff1a;

從上面可以看到,一個統(tǒng)計語言模型可以表示成,給定前面的的詞,求后面一個詞出現(xiàn)的條件概率。

我們在求P(W)時實(shí)際上就已經(jīng)建立了一個模型,這里的諸多條件概率就是模型的參數(shù)。如果能夠通過語料,將這些參數(shù)都學(xué)習(xí)到,就能夠計算出一個句子出現(xiàn)概率。

GPT的預(yù)訓(xùn)練過程就是利用語料,構(gòu)造訓(xùn)練數(shù)據(jù),利用上述語言模型,不斷預(yù)測,學(xué)習(xí)參數(shù)的過程。

3 GPT模型結(jié)構(gòu)

上述介紹了GPT如何利用無監(jiān)督語料和語言模型構(gòu)建任務(wù)進(jìn)行訓(xùn)練。那么GPT的網(wǎng)絡(luò)模型結(jié)構(gòu)長什么樣呢?訓(xùn)練過程優(yōu)化的網(wǎng)絡(luò),是個怎么樣的網(wǎng)絡(luò)呢?我們來看看。

GPT中引入的是Transformer中的解碼器部分,結(jié)構(gòu)如下圖所示:

解碼器與編碼器的差異在于self-attention層上,解碼器加了一層掩碼,這是為了在自注意力計算的時候屏蔽了來自當(dāng)前計算位置右邊所有單詞的信息。試想一下,在上述語言模型中,如果在預(yù)測下一個詞時,已經(jīng)知道下一個詞的信息了,這不是作弊嗎?這一點(diǎn)是與BERT這種雙向結(jié)構(gòu)不同的地方。

如上圖所示,GPT就是由12個這樣的解碼器堆疊而成,如果看過之前我們分析BERT文章的同學(xué),對這種結(jié)構(gòu)的理解,應(yīng)該會游刃有余了。

這里還值得一說的是下游任務(wù)如何基于GPT預(yù)訓(xùn)練之后進(jìn)行Finetune。以分類為例,只需在樣本前后分別加上Start和Extract符號,然后輸入GPT,再接上分類器即可進(jìn)行Finetune或者預(yù)測了。怎么樣?是不是非常的省心?

4 GPT2.0

其實(shí)相對于GPT1.0在模型結(jié)構(gòu)和訓(xùn)練模式上并沒有本質(zhì)的區(qū)別,GPT2.0僅僅是加大了模型結(jié)構(gòu)和訓(xùn)練語料的規(guī)模。

GPT2.0使用了約 1000 萬篇文章的數(shù)據(jù)集,文本集合達(dá) 40GB。這樣訓(xùn)練出來的語言模型優(yōu)勢很明顯,比使用專有數(shù)據(jù)集來的通用性更強(qiáng),更能理解語言和知識邏輯,可以用于任意領(lǐng)域的下游任務(wù)。

還有一個變化是,在GPT2.0中,OpenAI沒有再強(qiáng)調(diào)Finetune,也就說,OpenAI認(rèn)為,只要模型能力夠強(qiáng),語料夠好覆蓋面夠廣,Finetune的過程其實(shí)不是必要的。

5 總結(jié)

GPT,特別是GPT2.0是一個大型無監(jiān)督語言模型,能夠生產(chǎn)連貫的文本段落,在許多語言建?;鶞?zhǔn)上取得了 SOTA 表現(xiàn)。而且該模型在沒有任務(wù)特定訓(xùn)練的情況下,能夠做到初步的閱讀理解、機(jī)器翻譯、問答和自動摘要。

OpenAI非常的倔強(qiáng),一直沿用單向語言模型的思路。這個特點(diǎn)讓GPT2.0的語言生成能力令人驚嘆。GPT和BERT是目前為止影響力最大的兩種預(yù)訓(xùn)練語言模型,至今為止,勝負(fù)還沒有定論,我們且關(guān)注。

總結(jié)

GPT是一種非常重要而且成功的預(yù)訓(xùn)練語言模型,后續(xù)openAI肯定還會繼續(xù)更新他們的工作,對NLP從業(yè)者來說,這是非常值得期待的事情,我們拭目以待。

讀者們可以留言,或者加入我們的NLP群進(jìn)行討論。感興趣的同學(xué)可以微信搜索jen104,備注"加入有三AI NLP群"。

下期預(yù)告:XLnet:BERT和GPT的結(jié)合

知識星球推薦

掃描上面的二維碼,就可以加入我們的星球,助你成長為一名合格的自然語言處理算法工程師。

知識星球主要有以下內(nèi)容:

(1) 聊天機(jī)器人??紤]到聊天機(jī)器人是一個非常復(fù)雜的NLP應(yīng)用場景,幾乎涵蓋了所有的NLP任務(wù)及應(yīng)用。所以小Dream哥計劃以聊天機(jī)器人作為切入點(diǎn),通過介紹聊天機(jī)器人的原理和實(shí)踐,逐步系統(tǒng)的更新到大部分NLP的知識,會包括語義匹配,文本分類,意圖識別,語義匹配命名實(shí)體識別、對話管理以及分詞等。

(2) 知識圖譜。知識圖譜對于NLP各項任務(wù)效果好壞的重要性,就好比基礎(chǔ)知識對于一個學(xué)生成績好壞的重要性。他是NLP最重要的基礎(chǔ)設(shè)施,目前各大公司都在著力打造知識圖譜,作為一個NLP工程師,必須要熟悉和了解他。

(3) NLP預(yù)訓(xùn)練模型?;诤A繑?shù)據(jù),進(jìn)行超大規(guī)模網(wǎng)絡(luò)的無監(jiān)督預(yù)訓(xùn)練。具體的任務(wù)再通過少量的樣本進(jìn)行Fine-Tune。這樣模式是目前NLP領(lǐng)域最火熱的模式,很有可能引領(lǐng)NLP進(jìn)入一個全新發(fā)展高度。你怎么不深入的了解?


轉(zhuǎn)載文章請后臺聯(lián)系

侵權(quán)必究

往期精選

  • 【NLP】自然語言處理專欄上線,帶你一步一步走進(jìn)“人工智能技術(shù)皇冠上的明珠”。

  • 【NLP】用于語音識別、分詞的隱馬爾科夫模型HMM

  • 【NLP】用于序列標(biāo)注問題的條件隨機(jī)場(Conditional Random Field, CRF)

  • 【NLP】經(jīng)典分類模型樸素貝葉斯解讀

  • 【NLP】 NLP專欄欄主自述,說不出口的話就交給AI說吧

  • 【NLP】 深度學(xué)習(xí)NLP開篇-循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)

  • 【NLP】 NLP中應(yīng)用最廣泛的特征抽取模型-LSTM

  • 【NLP】 聊聊NLP中的attention機(jī)制

  • 【NLP】 理解NLP中網(wǎng)紅特征抽取器Tranformer

  • 【NLP】TransformerXL:因為XL,所以更牛

  • 【NLP】 深入淺出解析BERT原理及其表征的內(nèi)容

  • 【NLP】XLnet:GPT和BERT的合體,博采眾長,所以更強(qiáng)

  • 【每周NLP論文推薦】從預(yù)訓(xùn)練模型掌握NLP的基本發(fā)展脈絡(luò)

  • 【每周NLP論文推薦】 NLP中命名實(shí)體識別從機(jī)器學(xué)習(xí)到深度學(xué)習(xí)的代表性研究

  • 【每周NLP論文推薦】 介紹語義匹配中的經(jīng)典文章

  • 【技術(shù)綜述】深度學(xué)習(xí)在自然語言處理中的應(yīng)用

總結(jié)

以上是生活随笔為你收集整理的【NLP】GPT:第一个引入Transformer的预训练模型的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 国产免费一区二区三区最新6 | 污色视频 | 性高潮网站 | 欧美一级不卡 | 欧美在线一区二区视频 | 91成人网页| 免费的黄色的视频 | 成人av动漫在线观看 | 中文字幕不卡在线观看 | 国产成人观看 | 天天干国产 | 在线看片国产 | 久操视频在线 | 日日操日日爽 | 干成人网 | 芒果视频污污 | 成人在线激情 | 黄色免费片 | 天天狠天天插天天透 | 国产伦精品一区二区三区免.费 | 肉视频在线观看 | 国产嫩草在线 | 国产精品久免费的黄网站 | 成人性生活视频 | 国产成人啪精品 | av在线一区二区 | 狠狠躁日日躁夜夜躁 | 一区二区不卡视频在线观看 | 婷婷六月天 | 欧美一区视频 | 国产高清免费观看 | gai免费观看网站外网 | 天天槽| 天天插天天爱 | 亚洲天堂小说 | 中文字幕淫 | 婷婷综合色 | 狠狠干b | 亚洲网站视频 | 亚洲精品国产熟女久久久 | 国产精品久久久久久久久免费相片 | 精品久久久久成人码免费动漫 | 国产高清视频免费在线观看 | 91二区 | 性网址 | 亚洲激情五月婷婷 | av老司机久久| 久色视频在线播放 | 日本美女一区二区三区 | 少妇人妻一级a毛片 | 日韩成人久久 | 奇米影视9999| 中文字幕免费在线看线人 | 农村偷人一级超爽毛片 | 黄色片aaaa | 久久国产成人 | 精品视频一二三 | 欧美大片高清免费观看 | 超碰免费公开 | 国产在线观看精品 | 欧美成在线观看 | 中文在线日本 | 婷婷超碰 | 成人听书哪个软件好 | 蜜桃视频一区 | 日韩中文字幕在线看 | 欧美变态口味重另类 | 欧美s码亚洲码精品m码 | 在线免费观看黄 | 亚州一级 | 国产黄色自拍视频 | 国产一区二区麻豆 | 天天射天天干天天操 | 欧美精品一区二区三区蜜臀 | 国产 欧美 日韩 在线 | 国产不卡一 | 国产成人无码一二三区视频 | 久久精品黄色片 | 一区二区三区中文字幕 | 青娱乐在线免费视频 | 鲁在线视频 | 欧美一区二区影院 | 妖精视频在线观看免费 | 三级做爰第一次 | 成人免费网站 | 99在线小视频 | 亚洲美女屁股眼交8 | 欧美 日韩 国产 在线 | 涩涩视频在线观看 | 中文字幕一区二 | 麻豆传媒视频入口 | 97精品熟女少妇一区二区三区 | 久久大综合| 国产精品久久久久久久久久久久久久久久久 | 国产成人av一区二区 | 免费性爱视频 | 一级黄色片免费 | 色涩视频在线观看 | 我想看毛片 |