日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

【机器学习】坐标下降法(Coordinate descent)

發(fā)布時(shí)間:2023/12/20 编程问答 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【机器学习】坐标下降法(Coordinate descent) 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

coordinate-wise minimization(坐標(biāo)朝向最小)

coordinate-wise minimization介紹的是坐標(biāo)下降法的理論依據(jù)。

問(wèn)題的描述:給定一個(gè)可微的凸函數(shù),如果在某一點(diǎn),使得在每一個(gè)坐標(biāo)軸上都是最小值,那么是不是一個(gè)全局的最小值。

形式化的描述為:是不是對(duì)于所有的都有

這里的代表第個(gè)標(biāo)準(zhǔn)基向量。

答案為成立。

這是因?yàn)?#xff1a;

但是問(wèn)題來(lái)了,如果對(duì)于凸函數(shù),若不可微該會(huì)怎樣呢?

答案為不成立,上面的圖片就給出了一個(gè)反例。

那么同樣的問(wèn)題,現(xiàn)在,其中是可微的凸函數(shù),每一個(gè)都是凸的?這其實(shí)就是Lasso回歸的目標(biāo)函數(shù)

答案為成立。

證明如下,對(duì)每一個(gè)

給定一個(gè)可微的凸函數(shù),如果在某一點(diǎn),使得在每一個(gè)坐標(biāo)軸上都是最小值,那么就是一個(gè)全局的最小值。

坐標(biāo)下降(Coordinate descent)

坐標(biāo)下降法屬于一種非梯度優(yōu)化的方法,它在每步迭代中沿一個(gè)坐標(biāo)的方向進(jìn)行線性搜索(線性搜索是不需要求導(dǎo)數(shù)的),通過(guò)循環(huán)使用不同的坐標(biāo)方法來(lái)達(dá)到目標(biāo)函數(shù)的局部極小值

算法過(guò)程

假設(shè)目標(biāo)函數(shù)是求解的極小值,其中是一個(gè)n維的向量,我們從初始點(diǎn)開(kāi)始(是我們猜想的一個(gè)初值)對(duì)k進(jìn)行循環(huán):

相當(dāng)于每次迭代都只是更新的一個(gè)維度,即把該維度當(dāng)做變量,剩下的n-1個(gè)維度當(dāng)作常量,通過(guò)最小化來(lái)找到該維度對(duì)應(yīng)的新的值。坐標(biāo)下降法就是通過(guò)迭代地構(gòu)造序列來(lái)求解問(wèn)題,即最終點(diǎn)收斂到期望的局部極小值點(diǎn)。通過(guò)上述操作,顯然有:


證明如下:

當(dāng)時(shí),對(duì)應(yīng)的的值為

由于,所以,以此類推

所以

所以

同理可得,命題得證。


相比梯度下降法而言,坐標(biāo)下降法不需要計(jì)算目標(biāo)函數(shù)的梯度在每步迭代中僅需求解一維搜索問(wèn)題,所以對(duì)于某些復(fù)雜的問(wèn)題計(jì)算較為簡(jiǎn)便。但如果目標(biāo)函數(shù)不光滑的話,坐標(biāo)下降法可能會(huì)陷入非駐點(diǎn)。

流程總結(jié):

  • ?首先,我們把向量隨機(jī)取一個(gè)初值。記為,上面的括號(hào)里面的數(shù)字代表我們迭代的輪數(shù),當(dāng)前初始輪數(shù)為0。
  • ?對(duì)于第輪的迭代。我們從開(kāi)始,到為止,依次求。的計(jì)算表達(dá)式如上文所描述。
  • 檢查向量和向量在各個(gè)維度上的變化情況,如果在所有維度上變化都足夠小,那么即為最終結(jié)果,否則轉(zhuǎn)入第二步,繼續(xù)第輪的迭代。
  • 小結(jié)

    關(guān)于坐標(biāo)下降法,有幾點(diǎn)需要注意的:

  • 坐標(biāo)下降的順序是任意的,不一定非得按照從的順序來(lái),可以是從1到n的任意排列。
  • 坐標(biāo)下降的關(guān)鍵在于一次一個(gè)地更新,所有的一起更新有可能會(huì)導(dǎo)致不收斂。
  • 坐標(biāo)上升法和坐標(biāo)下降法的本質(zhì)一樣,只不過(guò)目標(biāo)函數(shù)成為求的極大值了,每次迭代過(guò)程變成了。
  • 坐標(biāo)軸下降法的求極值過(guò)程,可以和梯度下降做一個(gè)比較:

  • 坐標(biāo)軸下降法在每次迭代中在當(dāng)前點(diǎn)處沿一個(gè)坐標(biāo)方向進(jìn)行一維搜索?,固定其他的坐標(biāo)方向,找到一個(gè)函數(shù)的局部極小值。而梯度下降總是沿著梯度的負(fù)方向求函數(shù)的局部最小值。
  • 坐標(biāo)軸下降優(yōu)化方法是一種非梯度優(yōu)化算法。在整個(gè)過(guò)程中依次循環(huán)使用不同的坐標(biāo)方向進(jìn)行迭代,一個(gè)周期的一維搜索迭代過(guò)程相當(dāng)于一個(gè)梯度下降的迭代。
  • 梯度下降是利用目標(biāo)函數(shù)的導(dǎo)數(shù)來(lái)確定搜索方向的,該梯度方向可能不與任何坐標(biāo)軸平行。而坐標(biāo)軸下降法法是利用當(dāng)前坐標(biāo)方向進(jìn)行搜索,不需要求目標(biāo)函數(shù)的導(dǎo)數(shù),只按照某一坐標(biāo)方向進(jìn)行搜索最小值。
  • 兩者都是迭代方法,且每一輪迭代,都需要O(mn)的計(jì)算量(m為樣本數(shù),n為系數(shù)向量的維度)
  • ?

    參考文章

    Lasso回歸算法: 坐標(biāo)軸下降法與最小角回歸法小結(jié)

    機(jī)器學(xué)習(xí)筆記——簡(jiǎn)述坐標(biāo)下降法

    坐標(biāo)下降法(Coordinate descent)

    總結(jié)

    以上是生活随笔為你收集整理的【机器学习】坐标下降法(Coordinate descent)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

    如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。