日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

该放弃正在堕落的“RNN和LSTM”了

發(fā)布時(shí)間:2024/8/23 编程问答 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 该放弃正在堕落的“RNN和LSTM”了 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

摘要:?隨著技術(shù)的發(fā)展,作者覺得是時(shí)候放棄LSTM和RNN了!到底為什么呢?來看看吧~


遞歸神經(jīng)網(wǎng)絡(luò)(RNN),長(zhǎng)期短期記憶(LSTM)及其所有變體:

現(xiàn)在是放棄它們的時(shí)候了!

2014年,LSTMRNN重新復(fù)活。我們都閱讀過Colah的博客Karpathy對(duì)RNN贊賞。但那個(gè)時(shí)候我們都很年輕,沒有經(jīng)驗(yàn)。隨著這幾年的技術(shù)的發(fā)展,我們才慢慢發(fā)現(xiàn)序列變換(seq2seq)才是真正求解序列學(xué)習(xí)的真正模型,它在語音識(shí)別領(lǐng)域創(chuàng)造了驚人的結(jié)果,例如:蘋果SiriCortana谷歌語音助手Alexa。還有就是我們的機(jī)器翻譯,它可以將文檔翻譯成不同的語言。

然后在接下來的15年、16年,ResNetAttention模型出現(xiàn)了。人們可以更好地認(rèn)識(shí)到了LSTM其實(shí)就是一種巧妙的搭橋技術(shù)。注意,MLP網(wǎng)絡(luò)可以通過平均受上下文向量影響的網(wǎng)絡(luò)來取代,這個(gè)下文再談。

通過兩年的發(fā)展,今天我們可以肯定地說:放棄你的RNN和LSTM!”

有證據(jù)表明,谷歌FacebookSalesforce等企業(yè)正在越來越多地使用基于注意力模型的網(wǎng)絡(luò)。所有的這些公司已經(jīng)取代了RNN和基于注意力模型的變體,而這只是一個(gè)開始,因?yàn)?/span>RNN相較于注意力模型需要更多的資源來訓(xùn)練。

為什么?

RNNLSTM及其變體主要是隨著時(shí)間的推移使用順序處理,請(qǐng)參閱下圖中的水平箭頭:


這個(gè)箭頭意味著,數(shù)據(jù)必須在到達(dá)當(dāng)前處理單元之前順序穿過所有單元,這意味著它可以很容易出現(xiàn)梯度消失的問題。

為此,人們推出了LSTM模塊,它可以被看作是多個(gè)開關(guān)門的組合,ResNet就延續(xù)了它的設(shè)計(jì),它可以繞過某些單元從而記住更長(zhǎng)的時(shí)間步驟。因此,LSTM可以消除一些梯度消失的問題。


但并不是完全解決,正如你從上圖所看到的那樣。盡管如此,我們?nèi)匀挥幸粭l從過去的單元到現(xiàn)在的單元的順序路徑,實(shí)際上,現(xiàn)在這些路徑甚至變得更加復(fù)雜,因?yàn)槁窂缴线€連接了加如記憶的分支和遺忘記憶的分支。毫無疑問,LSTMGRU及變體能夠?qū)W習(xí)大量長(zhǎng)期的信息!但他們只是可以記住100s的序列,而不是1000s10000s甚至更多。


并且RNN的另一個(gè)問題是需要消耗大量的計(jì)算資源。在云中運(yùn)行這些模型也需要大量資源,并且由于語音到文本的需求正在迅速增長(zhǎng),云能提供的計(jì)算能力慢慢的滿足不了它了。


我們應(yīng)該怎么辦?


如果要避免順序處理,那么我們可以找到向前預(yù)測(cè)或更好的向后回顧的計(jì)算單元,因?yàn)槲覀兲幚淼臄?shù)據(jù)大部分都是實(shí)時(shí)因果數(shù)據(jù)。但在翻譯句子或分析錄制的視頻時(shí)并非如此,例如,我們擁有所有數(shù)據(jù)并且可以為其帶來更多時(shí)間。這樣的向前回溯/后向回顧單元就是神經(jīng)注意力模塊,我們此前在此解釋。


為了結(jié)合多個(gè)神經(jīng)注意力模塊,我們可以使用來自下圖所示的“?層級(jí)神經(jīng)注意力編碼器



觀察過去信息的更好方式是使用注意力模塊將過去編碼向量匯總到上下文向量?C_t。請(qǐng)注意上面有一個(gè)層級(jí)注意力模塊,它和層級(jí)神經(jīng)網(wǎng)絡(luò)非常相似。這也類似于下面的備注3中的時(shí)間卷積網(wǎng)絡(luò)(TCN

在層級(jí)神經(jīng)注意力編碼器中,多層級(jí)關(guān)注可以查看最近過去的一小部分,比如說100個(gè)向量,而上面的層可以查看這100個(gè)關(guān)注模塊,有效地整合100 x 100個(gè)向量的信息。這將層級(jí)神經(jīng)注意力編碼器的能力擴(kuò)展到10,000個(gè)以前的向量。但更重要的是查看表示向量傳播到網(wǎng)絡(luò)輸出所需的路徑長(zhǎng)度:在分層網(wǎng)絡(luò)中,它與logN成正比,其中N是層次結(jié)構(gòu)層數(shù)。這與RNN需要做的T步驟形成對(duì)比,其中T是要記住的序列的最大長(zhǎng)度,并且T >> N。

簡(jiǎn)單的說就是回顧更多的歷史信息并預(yù)測(cè)未來!

這種架構(gòu)跟神經(jīng)圖靈機(jī)很相似,但可以讓神經(jīng)網(wǎng)絡(luò)通過注意力決定從內(nèi)存中讀出什么。這意味著一個(gè)實(shí)際的神經(jīng)網(wǎng)絡(luò)將決定哪些過去的向量對(duì)未來決策的重要性。

但是存儲(chǔ)到內(nèi)存呢?上述體系結(jié)構(gòu)將所有先前的表示存儲(chǔ)在內(nèi)存中,這可能是相當(dāng)?shù)托У摹N覀兛梢宰龅氖翘砑恿硪粋€(gè)單元來防止相關(guān)數(shù)據(jù)被存儲(chǔ)。例如,不存儲(chǔ)與以前存儲(chǔ)的向量太相似的向量。最好的辦法就是讓應(yīng)用程序指導(dǎo)哪些載體應(yīng)該保存或不保存,這是當(dāng)前研究的重點(diǎn)。

我們看到很多公司仍然使用RNN / LSTM來完成自然語言處理和語音識(shí)別等任務(wù)模型,但很多人不知道這些網(wǎng)絡(luò)如此低效且無法擴(kuò)展。

總結(jié):

關(guān)于訓(xùn)練RNN / LSTMRNNLSTM很難訓(xùn)練,因?yàn)樗鼈冃枰獌?nèi)存、帶寬、這些因素限制計(jì)算的效率,這對(duì)于硬件設(shè)計(jì)師來說是最糟糕的噩夢(mèng),并且最終限制了神經(jīng)網(wǎng)絡(luò)解決方案的適用性。簡(jiǎn)而言之,每個(gè)LSTM單元需要的4個(gè)線性層(MLP層)在每個(gè)序列時(shí)間步上運(yùn)行。線性層需要計(jì)算大量的內(nèi)存帶寬,事實(shí)上,他們并不能經(jīng)常使用很多計(jì)算單元,因?yàn)橄到y(tǒng)沒有足夠的內(nèi)存帶寬來提供計(jì)算單元。添加更多計(jì)算單元很容易,但很難增加更多的內(nèi)存帶寬。因此,RNN / LSTM和變體與硬件加速不太匹配,我之前曾討論過這個(gè)問題在這里這里。

注:

1層級(jí)神經(jīng)注意力WaveNet的想法類似。但是我們不使用卷積神經(jīng)網(wǎng)絡(luò),而是使用層級(jí)神經(jīng)注意力模型。

2:層級(jí)神經(jīng)注意力模型也可以是雙向的。

3:這是一篇比較CNNRNN論文。時(shí)間卷積網(wǎng)絡(luò)(TCN在不同范圍的任務(wù)和數(shù)據(jù)集上優(yōu)于經(jīng)典的經(jīng)常性網(wǎng)絡(luò),如LSTM,同時(shí)展示更大的有效內(nèi)存。

原文鏈接

干貨好文,請(qǐng)關(guān)注掃描以下二維碼:


總結(jié)

以上是生活随笔為你收集整理的该放弃正在堕落的“RNN和LSTM”了的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 手机在线观看毛片 | 美国性生活大片 | 欧美亚色 | 国产精品久久久久久免费观看 | 亚洲涩涩爱 | 绯色av一区二区 | 无码h肉动漫在线观看 | 老熟妇仑乱视频一区二区 | 日韩免费在线视频观看 | 国产无套内射普通话对白 | 久久久久国产精品一区 | 黑人玩弄人妻一区二区三区四 | 中文字幕91视频 | wwwxxx在线播放 | 丰满岳妇乱一区二区三区 | 日韩欧美精品一区二区 | 91精品人妻一区二区三区果冻 | 久久亚洲AV无码专区成人国产 | 欧美伊人网 | 久热只有精品 | 国产精品无码AV无码国产 | www色综合| 亚洲精品一线 | caopeng在线 | 黑人操日本女人视频 | 操丝袜美女视频 | 欧美色xxx | 欧美日韩99 | 免费看欧美黄色片 | 欧美激情国产日韩精品一区18 | 色多多污污 | 亚洲成人自拍视频 | 九九色影院 | 波多野结衣免费视频观看 | 亚洲一区二区三区成人 | 午夜激情视频在线观看 | 亚洲第一综合网站 | 四虎8848| 日韩欧美精品免费 | 99热一区二区三区 | 亚洲精品欧美精品 | h亚洲 | 亚洲欧美偷拍一区 | 亚洲男男网站 | 国产精品羞羞答答在线 | 欧美乱论视频 | 女攻总攻大胸奶汁(高h) | 尤物视频官网 | 日韩午夜剧场 | 亚洲码视频 | 成人污在线观看 | 午夜爽爽影院 | 亚洲有吗在线 | 九七精品| 深夜在线视频 | hs网站在线观看 | 欧美在线视频一区 | 一级看片免费视频 | 狠狠爱免费视频 | 在线亚洲一区二区 | 亚洲精品社区 | 国产精品日日摸夜夜爽 | 国产美女黄网站 | 中文字幕永久 | 欧美日韩在线视频一区二区三区 | 午夜小影院 | 亚洲av成人一区二区国产精品 | 潘金莲一级淫片aaaaaa播放 | 国产亚洲精久久久久久无码苍井空 | 中文字幕+乱码+中文乱 | 日韩在线第一 | 黄色免费毛片 | 91视频在线免费看 | 在线播放网址 | 久热最新| 高清一区二区在线 | 在线观看麻豆视频 | 日韩黄色大片 | 韩国一区二区三区视频 | av小说免费在线观看 | 天天色官网 | 日韩av高清无码 | 国外成人在线视频 | 国产精品视频www | 亚洲人成网站999久久久综合 | 99黄色片| 超碰2025 | 天堂视频免费在线观看 | 亚洲在线a | 国产传媒一级片 | 亚洲资源网站 | 国产综合内射日韩久 | 亚洲天堂精品在线观看 | 视频在线91| 北条麻纪在线观看aⅴ | ass日本寡妇pics | 夜间福利在线观看 | 精品久久久中文字幕 | www.999热 |