日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【NLP】如何在文本分类任务中Fine-Tune BERT

發布時間:2025/3/12 编程问答 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【NLP】如何在文本分类任务中Fine-Tune BERT 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

問 題

BERT在許多自然語言理解(NLU)任務中取得了驚人的成果,但它的潛力還有待充分挖掘。目前很少有如何能進一步提高BERT性能的研究,因此,如何通過一些技巧和方法最大限度的提升BERT在文本分類任務中的性能是此次研究的重點。

?目?標

在使用BERT做 text classification的時候,我們利用[CLS]的hidden state輸出做為整個輸入文本的representation,通過一層task specific層(通常是Linear Layer),再經過Softmax層得到概率,輸出概率如下所示,其中的是task specific層的參數,最后通過最大化log-probability of correct label優化模型參數。

方?法

How to Fine-Tune BERT for Text Classification?[1]這篇論文從四個方面對BERT(BERT base)進行不同形式的pretrain和fine-tune,并通過實驗展示不同形式的pretrain和fine-tune之間的效果對比。

一、Fine-Tune策略

當我們在特定任務上fine-tune BERT的時候,往往會有多種方法利用Bert,舉個例子:BERT的不同層往往代表著對不同語義或者語法特征的提取,并且對于不同的任務,不同層表現出來的重要性和效果往往不太一樣。因此如何利用類似于這些信息,以及如何選擇一個最優的優化策略和學習率將會影響最終fine-tune 的效果。

  • 對于長文本的處理

① 截斷方法(不考慮[CLS]、[SEP]):

1.保留頭部(head-only):保留頭部最開始的510個tokens

2.保留尾部(tail-only):保留尾部最后的510個tokens

3.頭部加尾部(head+tail):頭部128+尾部382

② 分段的方法:

首先將輸入文本(長度為L)分成k = L/510個小段落,將它們依次輸入BERT得到k個文本段落的表示。每個段落的representation是最后一層[CLS]的hidden state,并分別使用mean pooling, max pooling and self-attention來合并所有段落的representation。上述兩種處理方法在IMDb和Chinese Sougou News datasets上的實驗效果如下所示,實驗結果表明,采取head+tail的方式處理長文本更具優勢。

  • Fine-tune層的選擇

BERT的每一層捕獲輸入文本的不同特性,Table 3顯示了在不同層Fine-tune BERT時performance的對比。實驗結果表明,BERT的最后一層更能表征下游任務(Layer-11表示fit前12層),在對其進行Fine-tune時效果也是最好的。

  • 學習率優化策略

通常BERT模型的低層包含更general的信息,而靠近頂部的層偏向于學習下游任務的相關知識,因此可以在頂層賦予較大的學習率,越往低層學習率越小。因此,我們的策略如公式(1)所示,其中代表第l層的學習率,我們設定base learning rate為,代表頂層的學習率,其他層的策略如公式(2)所示,其中是衰減系數,如果,那么每層的學習率是一樣的,如果,那么越往下的層學習率就越低。

??? ??????(1)

? ???(2)

  • 災難性遺忘問題

災難性遺忘(Catastrophic forgetting)是transfer learning中常見的問題,即在學習新知識的過程中,預訓練的知識有可能被遺忘或者抹去。因此,本文探討了BERT是否也存在這種災難性遺忘問題。如下圖所示,當采用較低的學習率時(文中采用2e-5),BERT在訓練的過程中能夠克服災難性遺忘問題,而當學習率較大時(文中采用4e-4),就會失去這種能力。

二、進一步預訓練

BERT預訓練模型是在通用領域(General Domain)上做的Training,很自然的一個想法就是在目標域(Target Domain)進一步pretrain。

  • 任務內進一步預訓練:

任務內(within-task)pretrain是指在任務域(通常指具體的任務,比如某一金融細分領域的文本分類任務)上對模型進行預訓練,預訓練的方式仍然是unsupervised masked language model and next sentence prediction tasks,實驗結果表明,任務內領域的預訓練可以提升模型的效果,但在進一步預訓練時需要注意training step,否則效果會變差。

  • 領域內和交叉域內的進一步預訓練:

In-Domain指的是某一領域內數據,比如金融領域、計算機領域等等,該領域的數據分布往往和任務內數據分布相似,這里的Cross-Domain在內容上可以理解為通用領域,作者通過實驗證明領域內(In-Domain)和任務內(Within-Task)的pretrain效果都會有提升,且通常情況下領域內的pretrain效果要好于任務內的pretrain效果,但在交叉域(或者說通用領域)上沒什么提升,理由是BERT預訓練本身就是在通用領域上訓練的。實驗結果對比如下圖所示,all sentiment/question/topic代表In-Domain pretrain,all代表 Cross-Domain,w/o pretrain代表原始的BERT base 模型。

三、多任務上的Fine-tune

在多任務數據域(比如多個文本分類的數據集,這樣做的目的是為了充分利用已有的分類任務數據)上做pretrain,然后在target-domain上進行fine-tune,也會提升模型的效果。其中,
BERT-FiT? =? “BERT + Fine-Tuning”.
BERT-CDPT-MFiT-FiT = “BERT + Cross-Domain Pre-Training+Multi-Task Pre-Training+ Fine-Tuning”.(先在交叉域上做pretrain,然后在多任務域上做pretrain,最后在target-domian上做fine-tune)

四、?少樣本學習

BERT pretrain model的一個優勢在于,在下游任務中,只需要少量的樣本就能fine-tune一個較好的模型,但是隨著數據的增大,在任務內數據的pretrain model和通用領域的pretrain model最后fine-tune的效果差不多,其中紅線代表BERT+Fine-tune,即直接利用BERT在target -domain上fine-tune,藍線代表BERT+ withIn-Task Pre-Training + Fine-Tuning,即先用BERT在within-task域上pretrain,然后在target-domain上fine-tune,這說明了BERT可以利用小數據改進下游任務,且小樣本數據上fine-tune效果較明顯,當然如果能事先在within-task域上做進一步的pretrain,再做fine-tune,效果會更好。

參考文獻

[1] Sun C , Qiu X , Xu Y , et al. How to Fine-Tune BERT for Text Classification?[C]// China National Conference on Chinese Computational Linguistics. Springer, Cham, 2019.

往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯 獲取本站知識星球優惠券,復制鏈接直接打開: https://t.zsxq.com/qFiUFMV 本站qq群704220115。加入微信群請掃碼: 與50位技術專家面對面20年技術見證,附贈技術全景圖

總結

以上是生活随笔為你收集整理的【NLP】如何在文本分类任务中Fine-Tune BERT的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 9999av | 99福利网 | 久久久经典 | 欧美一级高清片 | 欧洲成人免费视频 | 制服丝袜先锋 | 国产精品国产三级国产aⅴ浪潮 | 国产亚洲一区二区三区在线观看 | 成人av中文解说水果派 | 欧美人日b | 久久久久久中文字幕 | 17c在线| 短视频在线观看 | 国产黄色片免费在线观看 | 青青视频一区二区 | 亚洲国产成人精品激情在线 | 不卡av网| 国产91av在线 | 俺也去五月婷婷 | 视频在线看 | 向日葵视频在线播放 | 国模av| 人妻少妇精品一区二区三区 | 欧美a级在线免费观看 | 欧美一级爱爱视频 | 亚洲aⅴ | 色宗合| 天天干天天综合 | 国产精品日韩一区二区三区 | 玖玖爱在线精品视频 | 国产成人短视频在线观看 | 蜜桃麻豆视频 | 韩国av免费在线 | 91丨porny丨中文 | 熊猫电影yy8y全部免费观看 | 国产成人精品一区二区三区免费 | 久久老司机精品视频 | 亚洲在线中文字幕 | 777国产成人入口 | 操操操操操操操操操 | www.九九热| 懂色av | 亚洲AV无码片久久精品 | av天天堂| 国产伦精品免费视频 | 天堂成人网 | 麻豆剧场 | 懂色av中文一区二区三区天美 | 国产女人18毛片水真多1 | 精品无码av一区二区三区不卡 | 九九精品视频在线 | 欧美久久久久久 | 亚洲精品无吗 | 99成人免费视频 | 九九国产精品视频 | 午夜亚洲AV永久无码精品蜜芽 | 毛片123| 91免费小视频| 天堂资源网 | 中文字幕第二区 | 亚洲精品在线中文字幕 | 三浦理惠子av在线播放 | 91夫妻视频 | 国语对白| 四虎影院一区 | 日日夜夜爽爽 | 国产精品yy | 国产女教师一区二区三区 | 欧美怡红院一区二区三区 | 国产精久久久 | 爱露出| 亚洲第六页 | 亚洲精品一级片 | 亚洲精品一二三四区 | 岛国av动作片 | 国产成人av电影 | 丁香婷婷六月天 | 最新中文字幕免费视频 | 国产一区二区电影 | 欧美大片高清免费观看 | 五月丁香久久婷婷 | 日本变态折磨凌虐bdsm在线 | 国产黄色一区二区 | 色婷婷五 | 色欲国产精品一区二区 | 欧美日韩理论 | 中文字幕第12页 | 男人天堂伊人 | 亚洲欧美日韩精品在线 | 黄色一区二区视频 | 亚洲成人免费 | 日本在线播放 | 91av网址| 久艹在线| 精品人妻无码一区二区三 | 欢乐谷在线观看免费播放高清 | 污片网站 | 神马午夜在线 | 亚洲综合av一区二区 |