日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

3.5 梯度校验-机器学习笔记-斯坦福吴恩达教授

發布時間:2025/4/5 编程问答 23 豆豆
生活随笔 收集整理的這篇文章主要介紹了 3.5 梯度校验-机器学习笔记-斯坦福吴恩达教授 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

梯度校驗(Gradient Descent)

通常,直接使用BP算法可能會出現許多 bug,因此,需要使用稱為**梯度校驗(Gradient Checking)**的手段。我們知道, J(Θ)J(Θ)J(Θ)ΘΘΘ 處的倒數 ddΘJ(Θ)\frac d{dΘ}J(Θ)dΘd?J(Θ) 為該點的斜率,如下圖藍色線段所示:

我們可以在點 ΘΘΘ 附近的小區間 [Θ??,Θ+?](?足夠小)[Θ??,Θ+?] ( ? 足夠小)[Θ??,Θ+?]?,構造下圖所示的紅色直角三角形:

則斜邊的斜率可以近似等于藍色線段的斜率,亦即,可以通過求取紅色斜邊的斜率來近似 ddΘJ(Θ)\frac d{dΘ}J(Θ)dΘd?J(Θ)

ddΘJ(Θ)≈J(Θ+?)?J(Θ??)2?\frac d{dΘ}J(Θ)≈\frac{J(Θ+?)?J(Θ??)}{2?}dΘd?J(Θ)2?J(Θ+?)?J(Θ??)?

通常, ??? 取較小值,如 0.01 。

包含有梯度校驗的 BP 算法如下:

  • 首先由反向傳播算法獲得展開的 DVec :
    DVec=[D(1),D(2),D(3),...D(n)]DVec=[D^{(1)},D^{(2)},D^{(3)},...D^{(n)}]DVec=[D(1),D(2),D(3),...D(n)]

  • 計算梯度近似 gradApproxgrad\ Approxgrad?Approxθjθ_jθj?ΘjΘ^jΘj 的展開:
    ??θjJ(θ)≈J(θ1,…,θj+?,…,θn)?J(θ1,…,θj??,…,θn)2?,forj=1tongradApprox=[??θ1J(θ),??θ2J(θ),...,??θnJ(θ)]\frac ?{?θ_j}J(θ)≈\frac {J(θ_1,…,θ_j+?,…,θ_n)?J(θ_1,…,θ_j??,…,θ_n)}{2?},for\ j=1\ to\ n\ gradApprox=[\frac ?{?θ_1}J(θ),\frac ?{?θ_2}J(θ),...,\frac ?{?θ_n}J(θ)]?θj???J(θ)2?J(θ1?,,θj?+?,,θn?)?J(θ1?,,θj???,,θn?)?,for?j=1?to?n?gradApprox=[?θ1???J(θ),?θ2???J(θ),...,?θn???J(θ)]

  • 比較 gradApproxgradApproxgradApproxDVecDVecDVec 的相似程度(比如可以用歐氏距離):
    gradApprox≈DVecgradApprox≈DVecgradApproxDVec

  • 如果上式成立,則證明網絡中BP算法有效,此時關閉梯度校驗算法(因為梯度的近似計算效率很慢),繼續網絡的訓練過程。

    總結

    以上是生活随笔為你收集整理的3.5 梯度校验-机器学习笔记-斯坦福吴恩达教授的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。