日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

李宏毅-ELMO、BERT、GPT视频笔记

發(fā)布時(shí)間:2025/3/8 编程问答 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 李宏毅-ELMO、BERT、GPT视频笔记 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

本文根據(jù)李宏毅老師2019最新的機(jī)器學(xué)習(xí)視頻整理。

視頻地址:https://www.bilibili.com/video/av46561029/?p=61
ppt下載地址:http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML19.html

1、背景

機(jī)器是如何理解我們的文字的呢?最早的技術(shù)是1-of-N encoding,把每一個(gè)詞匯表示成一個(gè)向量,每一個(gè)向量都只有一個(gè)地方為1,其他地方為0。但是這么做詞匯之間的關(guān)聯(lián)沒有考慮,因?yàn)椴煌~之間的距離都是一樣的。

所以,接下來有了word class的概念,舉例說dog、cat和bird都是動(dòng)物,它們應(yīng)該是同類。但是動(dòng)物之間也是有區(qū)別的,如dog和cat是哺乳類動(dòng)物,和鳥類還是有些區(qū)別的。

后來有了更進(jìn)階的想法,稱作word embedding,我們用一個(gè)向量來表示一個(gè)單詞,相近的詞匯距離較近,如cat和dog。那word embedding怎么訓(xùn)練呢?比較熟知的就是word2vec方法。

但是呢,同一個(gè)詞是可能有不同的意思的,如下圖中的bank,前兩個(gè)指銀行,后兩個(gè)指河堤:

盡管有不同的意思,但使用傳統(tǒng)的word embedding的方法,相同的單詞都會(huì)對(duì)應(yīng)同樣的embedding。但我們希望針對(duì)不同意思的bank,可以給出不同的embedding表示。

根據(jù)上下文語境的不同,同一個(gè)單詞bank我們希望能夠得到不同的embedding,如果bank的意思是銀行,我們期望它們之間的embedding能夠相近,同時(shí)能夠與河堤意思的bank相距較遠(yuǎn)。

基于這個(gè)思想,首先有了ELMO。

2、ELMO

ELMO是Embeddings from Language Model的簡稱,ELMO是《芝麻街》中的一個(gè)角色。它是一個(gè)RNN-based的語言模型,其任務(wù)是學(xué)習(xí)句子中的下一個(gè)單詞或者前一個(gè)單詞是什么。

它是一個(gè)雙向的RNN網(wǎng)絡(luò),這樣每一個(gè)單詞都對(duì)應(yīng)兩個(gè)hidden state,進(jìn)行拼接便可以得到單詞的Embedding表示。當(dāng)同一個(gè)單詞上下文不一樣,得到的embedding就不同。

當(dāng)然,我們也可以搞更多層:

這么多層的RNN,內(nèi)部每一層輸出都是單詞的一個(gè)表示,那我們?nèi)∧囊粚拥妮敵鰜泶韱卧~的embedding呢?ELMO的做法就是我全都要:

在ELMO中,一個(gè)單詞會(huì)得到多個(gè)embedding,對(duì)不同的embedding進(jìn)行加權(quán)求和,可以得到最后的embedding用于下游任務(wù)。要說明一個(gè)這里的embedding個(gè)數(shù),下圖中只畫了兩層RNN輸出的hidden state,其實(shí)輸入到RNN的原始embedding也是需要的,所以你會(huì)看到說右下角的圖片中,包含了三個(gè)embedding。

但不同的權(quán)重是基于下游任務(wù)學(xué)習(xí)出來的,上圖中右下角給了5個(gè)不同的任務(wù),其得到的embedding權(quán)重各不相同。

3、Bert

Bert是Bidirectional Encoder Representations from Transformers的縮寫,它也是芝麻街的人物之一。Transformer中的Encoder就是Bert預(yù)訓(xùn)練的架構(gòu)。李宏毅老師特別提示:如果是中文的話,可以把字作為單位,而不是詞。

只是Transformer中的Encoder,那Bert怎么訓(xùn)練呢?文獻(xiàn)中給出了兩種訓(xùn)練的方法,第一個(gè)稱為Masked LM,做法是隨機(jī)把一些單詞變?yōu)镸ask,讓模型去猜測蓋住的地方是什么單詞。假設(shè)輸入里面的第二個(gè)詞匯是被蓋住的,把其對(duì)應(yīng)的embedding輸入到一個(gè)多分類模型中,來預(yù)測被蓋住的單詞。

另一種方法是預(yù)測下一個(gè)句子,這里,先把兩句話連起來,中間加一個(gè)[SEP]作為兩個(gè)句子的分隔符。而在兩個(gè)句子的開頭,放一個(gè)[CLS]標(biāo)志符,將其得到的embedding輸入到二分類的模型,輸出兩個(gè)句子是不是接在一起的。

實(shí)際中,同時(shí)使用兩種方法往往得到的結(jié)果最好。

在ELMO中,訓(xùn)練好的embedding是不會(huì)參與下游訓(xùn)練的,下游任務(wù)會(huì)訓(xùn)練不同embedding對(duì)應(yīng)的權(quán)重,但在Bert中,Bert是和下游任務(wù)一起訓(xùn)練的:

如果是分類任務(wù),在句子前面加一個(gè)標(biāo)志,將其經(jīng)過Bert得到的embedding輸出到二分類模型中,得到分類結(jié)果。二分類模型從頭開始學(xué),而Bert在預(yù)訓(xùn)練的基礎(chǔ)上進(jìn)行微調(diào)(fine-tuning)。

文中還有很多其他的應(yīng)用,如單詞分類:

如自然語言推理任務(wù),給定一個(gè)前提/假設(shè),得到推論是否正確:

最后一個(gè)例子是抽取式QA,抽取式的意思是輸入一個(gè)原文和問題,輸出兩個(gè)整數(shù)start和end,代表答案在原文中的起始位置和結(jié)束位置,兩個(gè)位置中間的結(jié)果就是答案。

具體怎么解決剛才的QA問題呢?把問題 - 分隔符 - 原文輸入到BERT中,每一個(gè)單詞輸出一個(gè)黃顏色的embedding,這里還需要學(xué)習(xí)兩個(gè)(一個(gè)橙色一個(gè)藍(lán)色)的向量,這兩個(gè)向量分別與原文中每個(gè)單詞對(duì)應(yīng)的embedding進(jìn)行點(diǎn)乘,經(jīng)過softmax之后得到輸出最高的位置。正常情況下start <= end,但如果start > end的話,說明是矛盾的case,此題無解。

Bert一出來就開始在各項(xiàng)比賽中嶄露頭角:

這里李宏毅老師還舉例了百度提出的ERNIE,ERNIE也是芝麻街的人物,而且還是Bert的好朋友,這里沒有細(xì)講,感興趣的話大家可以看下原文。

Bert學(xué)到了什么呢?可以看下下面兩個(gè)文獻(xiàn)(給大伙貼出來:https://arxiv.org/abs/1905.05950?和https://openreview.net/pdf?id=SJzSgnRcKX):

4、GPT-2

GPT是Generative Pre-Training 的簡稱,但GPT不是芝麻街的人物。GPT-2的模型非常巨大,它其實(shí)是Transformer的Decoder。

GPT-2是Transformer的Decoder部分,輸入一個(gè)句子中的上一個(gè)詞,我們希望模型可以得到句子中的下一個(gè)詞。

由于GPT-2的模型非常巨大,它在很多任務(wù)上都達(dá)到了驚人的結(jié)果,甚至可以做到zero-shot learning(簡單來說就是模型的遷移能力非常好),如閱讀理解任務(wù),不需要任何閱讀理解的訓(xùn)練集,就可以得到很好的結(jié)果。

GPT-2可以自己進(jìn)行寫作,寫得還是不錯(cuò)的!

好了,筆記就整理到這里了!點(diǎn)擊閱讀原文,觀看李宏毅老師的視頻喲~~

關(guān)于本站

“機(jī)器學(xué)習(xí)初學(xué)者”公眾號(hào)由是黃海廣博士創(chuàng)建,黃博個(gè)人知乎粉絲23000+,github排名全球前110名(32000+)。本公眾號(hào)致力于人工智能方向的科普性文章,為初學(xué)者提供學(xué)習(xí)路線和基礎(chǔ)資料。原創(chuàng)作品有:吳恩達(dá)機(jī)器學(xué)習(xí)個(gè)人筆記、吳恩達(dá)深度學(xué)習(xí)筆記等。

往期精彩回顧

  • 那些年做的學(xué)術(shù)公益-你不是一個(gè)人在戰(zhàn)斗

  • 適合初學(xué)者入門人工智能的路線及資料下載

  • 吳恩達(dá)機(jī)器學(xué)習(xí)課程筆記及資源(github標(biāo)星12000+,提供百度云鏡像)

  • 吳恩達(dá)深度學(xué)習(xí)筆記及視頻等資源(github標(biāo)星8500+,提供百度云鏡像)

  • 《統(tǒng)計(jì)學(xué)習(xí)方法》的python代碼實(shí)現(xiàn)(github標(biāo)星7200+)

  • 精心整理和翻譯的機(jī)器學(xué)習(xí)的相關(guān)數(shù)學(xué)資料

  • 首發(fā):深度學(xué)習(xí)入門寶典-《python深度學(xué)習(xí)》原文代碼中文注釋版及電子書

備注:加入本站微信群或者qq群,請回復(fù)“加群

加入知識(shí)星球(4300+用戶,ID:92416895),請回復(fù)“知識(shí)星球

總結(jié)

以上是生活随笔為你收集整理的李宏毅-ELMO、BERT、GPT视频笔记的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 久操网站| 成人亚洲玉足脚交系列 | www.在线观看视频 | 天天操天天射天天爱 | 亚洲乱码中文字幕 | 国产亚洲精品自拍 | 亚洲激情另类 | 精品无码一区二区三区爱欲 | 97精品超碰一区二区三区 | www四虎com| 国产91欧美 | 国产在线拍揄自揄拍无码视频 | 精品国产乱码久久久久 | 午夜精品一区二区三 | 亚洲精品中文字幕乱码三区91 | 午夜在线观看视频 | 日韩精品一区二区亚洲av性色 | 欧美久久一区二区三区 | 国产欧美一区二区 | 性高潮久久久久久 | 欧美激情一区二区视频 | 精品毛片一区二区三区 | 久久9久久 | 欧美第十页 | 日韩精品国产一区二区 | 国产亚洲一区二区在线 | 亚洲成人一区在线 | 国产乱论视频 | 亚洲男人天堂网站 | 日韩亚州 | 中文字幕一区二区人妻在线不卡 | 波多野结衣视频一区二区 | 国产精品99久久久久久久久久久久 | 国毛片| 在线观看日本一区 | 国产欧美日韩综合精品一区二区三区 | 波多野结衣网站 | av视| 欧美人与禽zozzo禽性配 | 东凛在线观看 | 91亚洲在线 | 欧美freesex黑人又粗又大 | 四虎在线观看视频 | 毛片在线免费播放 | 91精品91久久久中77777老牛 | 欧美日韩一二三四 | 日韩欧美视频免费在线观看 | 国产精品丝袜一区二区 | 中文字幕欧美在线 | 久久噜噜噜 | 一本色道久久88综合无码 | 日韩黄色一区二区 | 国产在线精品一区二区三区 | 已满十八岁免费观看全集动漫 | 亚洲AV无码精品自拍 | av激情小说 | 中出中文字幕 | 国产精品高潮AV无码 | 99re中文字幕| 99精品久久久久久 | 亚洲丁香色 | 脱裤吧导航 | 亚洲综合色婷婷 | 色99视频 | 欧美激情videos | 日韩理论在线 | 欧美三级黄色 | 天堂中文在线免费观看 | 三a大片| 久久噜噜噜 | 欧美三级 欧美一级 | 中文字幕 日本 | 亚洲黄色在线播放 | 91网站免费视频 | 91喷水视频 | 乱日视频 | 涩涩在线看 | 国产性在线 | 成人精品av | 无码国产精品一区二区色情男同 | 日本黄色片视频 | 欧美精品黄色 | 久久伊人爱| 羽月希奶水一区二区三区 | 欧美精品久久久久久久久久 | 99国产精品视频免费观看一公开 | 天天久久 | 日韩网站视频 | 日韩久久成人 | 黄色免费av | 国产精品粉嫩 | 色多多入口 | 黑人巨大av | 狠狠操在线 | 国产精品国产三级国产专区51区 | 中文字幕日韩三级片 | 成人一区二区三区四区 | 久久精彩视频 | 免费在线观看日韩 |