日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

机器学习笔记:梯度下降

發布時間:2025/4/5 编程问答 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 机器学习笔记:梯度下降 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1 梯度下降介紹

?我們首先隨機一個點,然后沿著梯度方向的反方向尋找最低點

?迭代多次,直到找到局部最優(也有可能是全局最優)【線性回歸問題里面,局部最優就是全局最優了】

多個參數同理,分別進行梯度下降

2.1 梯度與Hessian矩陣

?梯度為0的時候,不一定是local minimum。他還可能是local maxinum 和鞍點,那么,怎么判斷是不是local minimum呢?

我們類比一元二次方程a的正負和上下開口的問題,考慮二階導(hessian矩陣)

local minhessian矩陣半正定
local maxhessian矩陣半負定
鞍點hessian矩陣既不半正定也不半負定

2??梯度下降可能存在的問題

????????我們可能會找到鞍點,可能會找到局部最優,而且從不同位置出發,可能最終梯度下降的結果會有很大的區別

????????

3 梯度下降小tips

3.1?合理調整學習率

pytorch筆記:調整學習率(torch.optim.lr_scheduler)_UQI-LIUWJ的博客-CSDN博客

?3.2 特征縮放

????????當我們面對多維度特征問題的時候,我們需要保證這些特征都有相近的尺度,這樣會幫助梯度下降更快地收斂。

????????

? ? ? ? 以上圖為例,圖像非常扁平,梯度下降算法需要非常多次的迭代才能夠收斂

? ? ? ? 為了更快地收斂,我們將所有特征的尺度放縮到-1~1之間:

?

4 梯度下降原理

4.1 泰勒級數

我們可以用這種方式來近似函數f(x)

用求和的方式來寫,有:

4.1.1 用于函數近似的泰勒級數

?換言之,泰勒級數越靠后的項,越小。

因此,出于近似考慮,我們可以只考慮最初的兩項:

?4.1.2 多變量的泰勒近似

?4.2 梯度下降的理論,

?||v||是一樣的,所以我們的目標就是找的最小值

????????可以看成是向量和向量v的內積。那么什么時候內積的結果最小呢?就是

v=的時候

總結

以上是生活随笔為你收集整理的机器学习笔记:梯度下降的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。