當(dāng)前位置：首頁 >

UA SIE545 优化理论基础4 对偶理论简介6 求解对偶问题的梯度算法

發(fā)布時(shí)間：2025/4/14 45 豆豆

生活随笔收集整理的這篇文章主要介紹了 UA SIE545 优化理论基础4 对偶理论简介6 求解对偶问题的梯度算法小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

UA SIE545 優(yōu)化理論基礎(chǔ)4 對偶理論簡介6 求解對偶問題的梯度算法

這一講我們介紹求解對偶問題的另一個(gè)算法——梯度算法(gradient method)。

假設(shè)原問題為
$min?x∈Xf(x)s.t.g(x)≤0,h(x)=0\min_{x \in X}f(x) \ \ s.t. \ \ g(x) \le 0,h(x)=0$

假設(shè) $f, g, h$ 是連續(xù)函數(shù)， $X$ 是緊集。根據(jù)定義，這個(gè)優(yōu)化的對偶問題是
$max?u≥0θ(u,v)=max?u≥0min?x∈Xf(x)+uTg(x)+vTh(x)\max_{u \ge 0} \theta(u,v)=\max_{u \ge 0}\min_{x \in X} f(x)+u^Tg(x)+v^Th(x)$

假設(shè) $θ\theta$ 可微。考慮對偶問題可行域中的點(diǎn) $(uˉ,vˉ)(\bar u,\bar v)$ ，記
$xˉ=arg?min?x∈Xf(x)+uˉTg(x)+vˉTh(x)\bar x = \argmin_{x \in X}f(x)+\bar u^Tg(x)+\bar v^Th(x)$

則
$?θ(uˉ,vˉ)=[g(xˉ),h(xˉ)]T\nabla \theta(\bar u,\bar v) = [g(\bar x), \ h(\bar x)]^T$

引理如果 $d_u,d_v)$ 非零，則它是一個(gè)feasible ascent direction，其中
$(du,dv)=[g^(xˉ),h(xˉ)]T,g^i(xˉ)={gi(xˉ),uˉi>0max?(0,gi(xˉ)),uˉi=0(d_u,d_v)=[\hat g(\bar x), \ h(\bar x)]^T,\ \hat g_i(\bar x) = \begin{cases} g_i(\bar x), \bar u_i>0 \\ \max(0,g_i(\bar x)),\bar u_i = 0\end{cases}$

評注
i）我們先從直覺上理解一下這個(gè)結(jié)果，如果 $uˉ\bar u$ 每一個(gè)分量都滿足 $uˉi>0\bar u_i>0$ ，那么 $d_u,d_v)$ 就是 $θ\theta$ 的梯度，這時(shí)算法思路就是無約束優(yōu)化的梯度下降；如果 $uˉi=0\bar u_i=0$ ，說明當(dāng)前位置已經(jīng)位于可行域的邊界了，我們必須限制這個(gè)feasible ascent direction使它不會(huì)把我們帶到 $uˉi<0\bar u_i<0$ 的區(qū)域，因此需要定義 $g^i(xˉ)=max?(0,gi(xˉ))\hat g_i(\bar x)=\max(0,g_i(\bar x))$ 。

ii）與梯度下降類似，在有了這個(gè)feasible ascent direction之后，我們可以用line search的思路去找最優(yōu)的下降步長，
$max?λ{(lán)θ(uˉ+λdu,vˉ+λdv):uˉ+λdu≥0,λ≥0}\max_{\lambda} \{\theta(\bar u+\lambda d_u,\bar v + \lambda d_v):\bar u + \lambda d_u \ge 0 ,\lambda \ge 0\}$

獲得下一組 $(uˉ,vˉ)(\bar u,\bar v)$ 然后重復(fù)這個(gè)過程，下面證明的第一部分給出了最優(yōu)值的判定準(zhǔn)則。

證明

i）如果 $d_u,d_v)$ 為零向量，則 $(uˉ,vˉ)(\bar u,\bar v)$ 就已經(jīng)是對偶問題的解了。

因?yàn)閷ε紗栴}的目標(biāo)函數(shù)是concave function，所以對偶問題的KKT point就是最優(yōu)解，我們只需說明 $(uˉ,vˉ)(\bar u,\bar v)$ 滿足KKT條件即可，也就是 $?z1\exists z_1$ 滿足
$??uθ(uˉ,vˉ)?z1=0??vθ(uˉ,vˉ)=0z1Tuˉ=0,z1≥0-\nabla_u \theta(\bar u,\bar v)-z_1=0 \\ -\nabla_v \theta(\bar u,\bar v)=0 \\ z^T_1\bar u = 0,z_1 \ge 0$

因?yàn)?span id="ozvdkddzhkzd" class="katex--inline"> $d_v=0$ ，我們知道 $?vθ(uˉ,vˉ)=h(xˉ)=0\nabla_v \theta(\bar u,\bar v)=h(\bar x)=0$ ，并且為了使 $d_u=0$ ，需要 $?uθ(uˉ,vˉ)=g(xˉ)≤0\nabla_u \theta(\bar u,\bar v)=g(\bar x)\le 0$ ，以及 $g(xˉ)Tz1=0g(\bar x)^Tz_1=0$ ，因此存在 $z1=?g(xˉ)z_1=-g(\bar x)$ 滿足上述條件，所以 $(uˉ,vˉ)(\bar u,\bar v)$ 是對偶問題的解。

ii）如果 $d_u,d_v)$ 非零，在評注i）中我們已經(jīng)說明了 $d_u,d_v)$ 是一個(gè)feasible direction，下面我們說明它也是一個(gè)ascent direction，計(jì)算
$?θ(uˉ,vˉ)Td=?uθ(uˉ,vˉ)Tdu+?vθ(uˉ,vˉ)Tdv=gT(xˉ)g^(xˉ)+h(xˉ)Th(xˉ)\nabla \theta(\bar u,\bar v)^T d=\nabla_u \theta(\bar u,\bar v)^T d_u+\nabla_v \theta(\bar u,\bar v)^T d_v \\ = g^T(\bar x)\hat g(\bar x)+h(\bar x)^Th(\bar x)$

顯然它是大于零的。因此它是一個(gè)feasible ascent direction。

例用梯度方法求解下列優(yōu)化的對偶問題
$min?x12+x22s.t.?x1+x2+4≤0x1+2x2?8≤0\min x_1^2+x_2^2 \\ s.t. -x_1+x_2 + 4 \le 0 \\ x_1+2x_2-8 \le 0$

假設(shè)初始值為 $u_1,u_2)=(0,0)$ 。

解
我們先寫出對偶問題的目標(biāo)函數(shù)
$θ(u1,u2)=min?{x12+x22+u1(?x1?x2+4)+u2(x1+2x2?8)}\theta(u_1,u_2) = \min\{x_1^2+x_2^2+u_1(-x_1-x_2+4) \\ +u_2(x_1+2x_2-8)\}$

第一次循環(huán)： $u_1,u_2)=(0,0)$
$θ(u1,u2)=θ(0,0)=0\theta(u_1,u_2) = \theta(0,0)=0$ ，此時(shí) $x_1=x_2=0$ ，因此
$d_1,d_2) = (\max(0,4),\max(0,-8)) = (4,0)$

此時(shí)
$θ(u1+λd1,u2+λd2)=?8λ2+16λ\theta(u_1+\lambda d_1,u_2+\lambda d_2)=-8\lambda^2+16\lambda$

當(dāng) $λ=1\lambda=1$ 時(shí)上式取最大值，因此下一次迭代使用 $u_1,u_2)=(4,0)$ 。

第二次循環(huán)： $u_1,u_2)=(4,0)$
類似第一次循環(huán)的操作，可以計(jì)算出 $d_1,d_2)=(0,0)$ ，因此 $(4, 0)$ 是對偶問題的最優(yōu)解。

總結(jié)

以上是生活随笔為你收集整理的UA SIE545 优化理论基础4 对偶理论简介6 求解对偶问题的梯度算法的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： UA SIE545 优化理论基础4 对偶
下一篇： UA MATH563 概率论的数学基础

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

UA SIE545 优化理论基础4 对偶理论简介6 求解对偶问题的梯度算法

UA SIE545 優(yōu)化理論基礎(chǔ)4 對偶理論簡介6 求解對偶問題的梯度算法

總結(jié)