人工智能AI实战100讲(五)-基于强化学习的自动化剪枝模型
1介紹
文中涉及代碼請(qǐng)參見(jiàn):
人工智能AI-圖像處理cv-基于強(qiáng)化學(xué)習(xí)的自動(dòng)化裁剪
目前的強(qiáng)化學(xué)習(xí)工作很多集中在利用外部環(huán)境的反饋訓(xùn)練agent,忽略了模型本身就是一種能夠獲得反饋的環(huán)境。本項(xiàng)目的核心思想是:將模型視為環(huán)境,構(gòu)建附生于模型的 agent ,以輔助模型進(jìn)一步擬合真實(shí)樣本。
大多數(shù)領(lǐng)域的模型都可以采用這種方式來(lái)優(yōu)化,如cv/多模態(tài)等。它至少能夠以三種方式工作:
1.過(guò)濾噪音信息,如刪減語(yǔ)音或圖像特征;
2.進(jìn)一步豐富表征信息,如高效引用外部信息;
3.實(shí)現(xiàn)記憶、聯(lián)想、推理等復(fù)雜工作,如構(gòu)建重要信息的記憶池。
這里推出一款早期完成的裁剪機(jī)制transformer版本(后面稱(chēng)為APT),實(shí)現(xiàn)了一種更高效的訓(xùn)練模式,能夠優(yōu)化模型指標(biāo);此外,可以使用動(dòng)態(tài)圖丟棄大量的不必要單元,在指標(biāo)基本不變的情況下,大幅降低計(jì)算量。
該項(xiàng)目希望為大家拋磚引玉。
2為什么要做自動(dòng)剪枝
在具體任務(wù)中,往往存在大量毫無(wú)價(jià)值的信息和過(guò)渡性信息,有時(shí)不但對(duì)任務(wù)無(wú)益,還會(huì)成為噪聲。比如:表述會(huì)存在冗余/無(wú)關(guān)片段以及過(guò)渡性信息
總結(jié)
以上是生活随笔為你收集整理的人工智能AI实战100讲(五)-基于强化学习的自动化剪枝模型的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 人工智能超强面经:文本检测与GAN篇(含
- 下一篇: 人工智能AI实战100讲(六)-利用CN