日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

谷歌更强 NLP 模型 XLNet 开源:20 项任务全面碾压 BERT!

發布時間:2025/3/21 编程问答 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 谷歌更强 NLP 模型 XLNet 开源:20 项任务全面碾压 BERT! 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

谷歌更強 NLP 模型 XLNet 開源:20 項任務全面碾壓 BERT!

?

11 月份,谷歌研究團隊在 GitHub 上發布了萬眾期待的 BERT,它不僅在 11 項 NLP 測試中刷新了最高成績,甚至還表現出全面超越人類的驚人結果。但 BERT 帶來的震撼還未平息,今日又一個令眾多 NLPer 興奮的消息發布: CMU 與谷歌大腦提出的全新 XLNet 在 20 個任務上超過了 BERT 的表現,并在 18 個任務上取得了當前最佳效果!而更令人激動的是,目前 XLNet 已經開放了訓練代碼和大型預訓練模型。雷鋒網 AI 科技評論將其具體內容整理如下。

XLNet 信息發布

BERT 與 XLNet 的關系

與基于自回歸語言建模的預訓練處理方法相比,基于自編碼的預訓練處理方法(比如 BERT)具有良好的雙向上下文建模能力。然而,由于依賴于使用掩碼破壞輸入,BERT 忽略了掩碼位置之間的依賴關系,并出現了預訓練-微調( pretrain-finetune) 差異。

XLNet 則是基于 BERT 的優缺點,提出的一種泛化自回歸預訓練方法。它通過最大化因子分解順序所有排列的期望似然來實現雙向上下文的學習;通過自回歸公式克服了 BERT 的局限性,并將來自 Transformer-XL(最先進的自回歸模型) 的思想集成到預訓練中,在長文本表示的語言任務中表現出了優異的性能。

XLNet 誕生背景

首先,我們要理解兩個概念:自回歸 (AR) 語言建模和自編碼 (AE)。

無監督表示學習在自然語言處理領域非常成功。通常,這些方法首先在大規模無標記文本語料庫上對神經網絡進行預訓練,然后對下游任務的模型或表示進行微調。在這一共同的高層次思想下,不同的無監督預訓練目標在相關文獻中得到了探索。其中,自回歸語言建模和自編碼是兩個最成功的預訓練目標。

AR 語言建模是利用自回歸模型估計文本語料庫的概率分布。具體來說,給定一個文本序列 x = (x1, … ,xT),AR 語言模型將這種可能性分解為前向乘積或后向乘積。一個參數模型 (如神經網絡) 被訓練來對每個條件分布建模。由于 AR 語言模型僅被訓練為編碼單向上下文 (向前或向后),因此它在建模深層雙向上下文時并沒有產生效果。相反的是下游語言理解任務,通常需要雙向上下文信息。這導致了 AR 語言建模和有效的預訓練之間的差距。

給定相同輸入序列 x 但因子分解順序不同的情況下,預測 x3 的置換語言建模目標的說明

相比之下,基于 AE 的預訓練不執行顯式密度估計,而是旨在從輸入重構原始數據。而一個著名的例子就是 BERT,它采用了最先進的預訓練方法。給定輸入 token 序列,用一個特殊符號 [MASK] 替換其中的特定部分,并且訓練模型從損壞的版本中恢復原 token。

由于密度估計不是目標的一部分,BERT 可以利用雙向上下文進行重建。直接的好處就是這消除了 AR 語言建模中的雙向信息差距,從而提高了性能。然而,BERT 在預訓練使用的 [MASK] 等人工符號實際數據中并不存在,導致了預訓練的網絡差距。此外,由于預測的 token 在輸入中被重新掩蓋,BERT 無法像 AR 語言建模一樣使用乘積規則對聯合概率進行建模。

因此,針對現有語言預訓練目標的優缺點,CMU 與谷歌大腦提出了將 AR 和 AE 的優點充分結合的泛化自回歸預訓練模型 XLNet。

XLNet 詳解

首先,XLNet 不使用傳統 AR 模型中固定的前向或后向因式分解順序,而是最大化所有可能因式分解順序的期望對數似然。因為是對因式分解順序的排列操作,每個位置的上下文都可以由來自左右兩邊的 token 組成。在期望中,每個位置都要學會利用來自所有位置的上下文信息,即捕獲雙向上下文。

其次,作為一種泛化的 AR 語言模型,XLNet 不依賴于殘余數據。因此,XLNet 不受 BERT 的預訓練-微調差異的影響。同時,自回歸目標也提供了一種自然的方法來使用乘積規則對預測 token 的聯合概率執行因式分解,消除了 BERT 中做出的獨立性假設。

除了一個新的預訓練目標,XLNet 還改進了預訓練的架構設計。

受 AR 語言建模最新進展的啟發,XLNet 將 Transformer-XL 的分段重復機制和相對編碼方案集成到預訓練中,在較長文本序列的任務中提高了性能。需要注意的是,將 Transformer(-XL) 架構簡單應用于基于排列的語言建模是不起作用的,因為分解順序是任意的且目標是模糊的。作為一種解決方案,研究者們提出重新參數化 Transformer(-XL) 網絡,以消除歧義。

實驗結果

截至 2019 年 6 月 19 日,XLNet 在 20 個任務上超過了 BERT 的表現,并在 18 個任務上取得了當前最佳效果(state-of-the-art),包括機器問答、自然語言推斷、情感分析和文檔排序。

以下是 XLNet-Large 和 Bert-Large 的一些比較:

閱讀理解任務

文本分類任務

ClueWeb09-B 文檔排名任務

在最終的 20 項任務中,XLNet 的表現優于 BERT,并且在 18 項任務中取得了最先進的結果。

發布模型

截至目前,已提供以下模式:

XLNet-Large, Cased:24-layer, 1024-hidden, 16-heads,

每個.zip 文件包含三個項:

TensorFlow checkpoint(xlnet_model.ckpt),包含預先訓練的權重。

SentencePiece 模型 (spiece.model),用于 (de) 標記化。

一個配置文件 (xlnet_config.json),指定模型的超參數。

未來釋放計劃

后續開發者還計劃在不同的環境下繼續發布更多的訓練模型,包括:

基本模型——將在 2019 年 6 月底發布一個 XLNet-Base。

Uncased 模型——目前,Cased XLNet-Large 比 Uncased XLNet-Large 性能更好。開發者仍在觀察與研究,當得出結論時,他們將馬上發布 Uncased 模型。(預計時間不會太久)

在維基百科上進行微調的預訓練模型,這可用于維基百科文本的任務,如 SQuAD 和 HotpotQA。

其他超參數配置的預訓練模型,可以用于特定的下游任務。

與新技術關聯的預訓練模型。

相關鏈接

論文地址

https://arxiv.org/pdf/1906.08237.pdf

預訓練模型及代碼地址

https://github.com/zihangdai/xlnet

總結

以上是生活随笔為你收集整理的谷歌更强 NLP 模型 XLNet 开源:20 项任务全面碾压 BERT!的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 污污视频在线观看免费 | 午夜时刻免费入口 | 在线观看成人小视频 | 波多野结衣一级 | 一级二级三级黄色片 | 日大逼 | 青青草视频黄 | 日批视频免费播放 | 久久婷婷国产麻豆91天堂 | 国产精品腿扒开做爽爽爽挤奶网站 | 另类男人与善交video | 51精品国自产在线 | 草久在线视频 | 国语av | 都市激情亚洲 | 精品国产第一页 | 岛国福利视频 | 青青草国产一区二区三区 | 亚洲欧美日韩综合一区二区 | 少妇光屁股影院 | 日日夜夜干 | 国产乱码精品一区二区三区中文 | 久久b| 国产又粗又猛又爽又黄av | 亚洲国产一区二区三区四区 | 超碰在线c | 国产成人精品一区二区 | 色偷偷网 | 国内少妇毛片视频 | 欧美人与性禽动交精品 | 国产极品999 | 婷婷调教口舌奴ⅴk | 丰满岳乱妇在线观看中字无码 | 牛夜精品久久久久久久99黑人 | 久久亚洲精华国产精华液 | 办公室大战高跟丝袜秘书经理ol | 天天色天天看 | 丰满人妻熟女aⅴ一区 | 中文字幕在线播放一区二区 | 伊人亚洲综合 | 黄色av国产 | 成人免费视频国产免费麻豆 | 中文视频在线观看 | 国产第页| 一级片免费播放 | 成年视频在线观看 | 少妇精品一区 | 国产高清视频在线 | 国产免费不卡视频 | 夜夜嗨一区二区三区 | 欧美另类69| 日韩在线视频一区 | 天堂av资源在线观看 | 亚洲精品一区二区三区中文字幕 | 国产精品久久久久久久一区二区 | 国内外成人激情视频 | 亚洲乱码国产乱码精品精剪 | 亚洲激情图 | 精品夜夜澡人妻无码av | 毛片视屏| 亚洲av人无码激艳猛片服务器 | 伊人天天 | 岛国av毛片 | 日女人免费视频 | 婷婷深爱激情 | 日本女教师电影 | 污片免费看 | 精品国产a | 激情一区| 夜夜爽av | 深夜成人福利视频 | 法国空姐在线观看完整版 | 色哟哟一区二区三区四区 | 日韩欧美亚洲一区 | 国产这里只有精品 | 好吊操这里只有精品 | 国产剧情av麻豆香蕉精品 | 色性av| www国产亚洲精品 | 久草毛片 | 国产伦精品一区二区三区四区 | 99热首页 | 99色99| 亚洲激情综合网 | 97精品一区二区 | 亚洲h在线观看 | av网站免费大全 | 丰满的人妻hd高清日本 | 超碰caoporen| 九九在线观看高清免费 | 善良的公与媳hd中文字 | 亚洲综合第一 | 午夜污污 | 网站毛片 | 香蕉视频一级片 | 五月丁香啪啪 | 999av视频| 黄色顶级片 | 久久久久久久国产视频 |