日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

rnn 梯度消失爆炸

發(fā)布時間:2024/10/8 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 rnn 梯度消失爆炸 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

文章目錄

    • 梯度消失和爆炸原理
      • 求導知識
      • RNN推導

梯度消失和爆炸原理

求導知識

y=x2y = x^2y=x2

dy\mathrmozvdkddzhkzd {y}dy 導數(shù)

dydx\Large \frac {\mathcalozvdkddzhkzd {y}} {\mathcalozvdkddzhkzd{x}}dxdy? 偏導

RNN推導

正向傳播:

at=wxxt+whht?1+bta_t=w_xx_t + w_hh_{t-1} + b_tat?=wx?xt?+wh?ht?1?+bt?

ht=σ(at)h_t = \sigma(a_t)ht?=σ(at?)

y^=softmax(wyht+by)\hat{y} =softmax(w_yh_t+b_y)y^?=softmax(wy?ht?+by?)

定義loss:
用logloss,TODO:多分類的logloss為啥是下面的格式?為啥不是loss=∑[?ylog(y^)?(1?y)log(1?y^)]loss = \sum[-ylog(\hat{y})-(1-y)log(1-\hat{y})]loss=[?ylog(y^?)?(1?y)log(1?y^?)]

loss=L=∑i=1n?yilog(yi^)loss = \mathcal{L} = \displaystyle\sum_{i=1}^{n}-y_ilog(\hat{y_i})loss=L=i=1n??yi?log(yi?^?)

dLdwt=dLdatdatdwt=dLdat\Large \frac {\mathrmozvdkddzhkzd\mathcal{L}} {\mathrmozvdkddzhkzdw_t} = \frac {\mathrmozvdkddzhkzd\mathcal{L}} {\mathrmozvdkddzhkzda_t} \frac{\mathrmozvdkddzhkzda_t} {\mathrmozvdkddzhkzdw_t}= \frac {\mathrmozvdkddzhkzd\mathcal{L}} {\mathrmozvdkddzhkzda_t}dwt?dL?=dat?dL?dwt?dat??=dat?dL?

參考1
參考2
參考3

總結

以上是生活随笔為你收集整理的rnn 梯度消失爆炸的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。