日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【干货】人人都能看懂的LSTM

發布時間:2023/12/4 编程问答 40 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【干货】人人都能看懂的LSTM 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.


推薦閱讀時間:8min~13min

推薦理由:這是在看了臺大李宏毅教授的深度學習視頻之后的一點總結和感想。看完介紹的第一部分RNN尤其LSTM的介紹之后,整個人醍醐灌頂。


10. 從RNN說起



循環神經網絡(Recurrent Neural Network,RNN)是一種用于處理序列數據的神經網絡。相比一般的神經網絡來說,他能夠處理序列變化的數據。比如某個單詞的意思會因為上文提到的內容不同而有不同的含義,RNN就能夠很好地解決這類問題。


2?普通RNN



先簡單介紹一下一般的RNN。

其主要形式如下圖所示(圖片均來自臺大李宏毅教授的PPT):



通過序列形式的輸入,我們能夠得到如下形式的RNN。


3? LSTM2.1 什么是LSTM


長短期記憶(Long short-term memory, LSTM)是一種特殊的RNN,主要是為了解決長序列訓練過程中的梯度消失和梯度爆炸問題。簡單來說,就是相比普通的RNN,LSTM能夠在更長的序列中有更好的表現。


LSTM結構(圖右)和普通RNN的主要輸入輸出區別如下所示。





2.2 深入LSTM結構


下面具體對LSTM的內部結構來進行剖析。

下面開始進一步介紹這四個狀態在LSTM內部的使用。(敲黑板)


LSTM內部主要有三個階段:


4? 總結


以上,就是LSTM的內部結構。通過門控狀態來控制傳輸狀態,記住需要長時間記憶的,忘記不重要的信息;而不像普通的RNN那樣只能夠“呆萌”地僅有一種記憶疊加方式。對很多需要“長期記憶”的任務來說,尤其好用。


但也因為引入了很多內容,導致參數變多,也使得訓練難度加大了很多。因此很多時候我們往往會使用效果和LSTM相當但參數更少的GRU來構建大訓練量的模型。

對于GRU我會在以后的文章中進行介紹。


總結

以上是生活随笔為你收集整理的【干货】人人都能看懂的LSTM的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。