日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

【GAN优化】详解GAN中的一致优化问题

發(fā)布時(shí)間:2025/3/20 编程问答 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【GAN优化】详解GAN中的一致优化问题 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

GAN的訓(xùn)練是一個(gè)很難解決的問(wèn)題,上期其實(shí)只介紹了一些基本的動(dòng)力學(xué)概念以及與GAN的結(jié)合,并沒(méi)有進(jìn)行過(guò)多的深入。動(dòng)力學(xué)是一門比較成熟的學(xué)科,有很多非常有用的結(jié)論,我們將嘗試將其用在GAN上,來(lái)得到一些有意義的結(jié)果,指導(dǎo)一下我們?cè)趺从?xùn)練GAN。

作者&編輯 | 小米粥

本期我們將首先介紹一個(gè)有關(guān)于動(dòng)力學(xué)的收斂性命題,然后將GAN運(yùn)用到上面,接著進(jìn)行深入分析達(dá)到收斂的條件并最終引出了一個(gè)比較好的優(yōu)化算法:一致優(yōu)化。

1 一個(gè)重要的命題

先不談GAN,先介紹一個(gè)特別重要的與動(dòng)力學(xué)收斂性相關(guān)的命題,考慮一個(gè)如下形式的函數(shù):

其中h大于0。有這樣一個(gè)命題:如果存在一個(gè)比較特殊的點(diǎn)(不動(dòng)點(diǎn))使得:

而且在該不動(dòng)點(diǎn),函數(shù)F(x)的雅可比矩陣F'(x)的所有特征值(非對(duì)稱矩陣的特征值為復(fù)數(shù))的絕對(duì)值均小于1,則從該不動(dòng)點(diǎn)的一小鄰域內(nèi)的任意一點(diǎn)開(kāi)始,使用如下形式的數(shù)值迭代法:

則F最終會(huì)收斂至:?

為了直觀描述,上述的數(shù)值迭代過(guò)程其實(shí)是在使用數(shù)值迭代的方式求:y=x和y=x+hG(x)兩個(gè)函數(shù)的交點(diǎn),如下示意:

非常難得有一個(gè)好的關(guān)于收斂性的結(jié)論,而且其數(shù)值迭代的方式與實(shí)際的GAN訓(xùn)練方式也吻合,我們考慮將GAN對(duì)接到這個(gè)結(jié)論中。

2 對(duì)接GAN

上一期中,我們已經(jīng)給出了GAN的動(dòng)力學(xué)系統(tǒng)的介紹,為了方便起見(jiàn),我們將生成器和判別器的目標(biāo)函數(shù)均寫成max的形式:?

那么對(duì)應(yīng)于第一小節(jié)的式子,x對(duì)應(yīng)為GAN的參數(shù):

而h可以對(duì)應(yīng)為訓(xùn)練時(shí)候的學(xué)習(xí)速率,G(x)則對(duì)應(yīng)為矢量場(chǎng)v:

這樣看來(lái),式子表達(dá)的意思就是使用同時(shí)梯度下降法進(jìn)行參數(shù)更新(由于將目標(biāo)函數(shù)寫成max形式,準(zhǔn)確來(lái)說(shuō)是梯度上升法,無(wú)傷大雅):

將一般形式與GAN對(duì)接起來(lái)后,再次考慮之前關(guān)于收斂性的結(jié)論,即如果存在滿足如下形式的點(diǎn)(即不動(dòng)點(diǎn)),并且在不動(dòng)點(diǎn),矢量場(chǎng)v的雅可比矩陣的所有特征值的絕對(duì)值均小于1,則從該不動(dòng)點(diǎn)的某一個(gè)鄰域內(nèi)任意一點(diǎn)開(kāi)始迭代,最終會(huì)進(jìn)入收斂狀態(tài)。

其實(shí)前一個(gè)條件無(wú)非就是說(shuō)在不動(dòng)點(diǎn),v=0,即損失函數(shù)的梯度為0。那么我們可以對(duì)GAN的訓(xùn)練過(guò)程進(jìn)行“檢查”,當(dāng)出現(xiàn)一個(gè)梯度為0的參數(shù)點(diǎn)時(shí),“檢查”其矢量場(chǎng)的雅可比矩陣的特征值是否都在單位圓內(nèi),如果在則GAN的迭代最終會(huì)收斂進(jìn)該點(diǎn)。

3 特征值分析

訓(xùn)練GAN要找到梯度為0似乎不是那么困難,但是實(shí)現(xiàn)第二個(gè)條件:在不動(dòng)點(diǎn)的矢量場(chǎng)v的雅可比矩陣的所有特征值的絕對(duì)值均小于1 可能比較困難,我們來(lái)詳細(xì)分析一下。考慮一般情況下的表達(dá)式:

F(x)的雅可比矩陣為:?

對(duì)其進(jìn)行特征值分解,單位矩陣I的特征值是實(shí)數(shù)1,而考慮到一般情況下矩陣G'(x)是非對(duì)稱矩陣,則其特征值必然是復(fù)數(shù),設(shè)G'(x)分解出的特征值為:

F'(x)分解出的特征值為:

通常情況如下圖所示:

特征值很容易跑出到單位圓之外。要保證其絕對(duì)值小于1(即在單位圓里),首先要保證a小于0,(a大于等于0時(shí),該條件不可能滿足),如下所示:

即G'(x)分解出的特征值的實(shí)部為負(fù)數(shù),此時(shí):

也就是說(shuō),要想進(jìn)入收斂狀態(tài),特征值的實(shí)部要為負(fù)數(shù),且同時(shí)要求學(xué)習(xí)速率h一定要足夠小!其上界取決于特征值。但是這里有一個(gè)矛盾點(diǎn),如果你將學(xué)習(xí)速率設(shè)置得太小,你的訓(xùn)練時(shí)長(zhǎng)將會(huì)變得特別長(zhǎng)。

同樣地,在GAN中,需要保證矢量場(chǎng)v的雅可比矩陣

的所有特征值的實(shí)部為負(fù)數(shù)。但是實(shí)際中,這個(gè)條件是不太可能達(dá)到的,尤其是存在實(shí)部幾乎為0而虛部的值比較大的情況,而且學(xué)習(xí)速率要設(shè)置的足夠小。

注意到矢量場(chǎng)v的雅可比矩陣是與生成器和判別器的目標(biāo)函數(shù)f、g相關(guān)的,考慮調(diào)整一下f和g,使得在不動(dòng)點(diǎn)處的特征值的實(shí)部為負(fù)數(shù)。

4 一致優(yōu)化

一致優(yōu)化(Conseensus Optimization)是一種理論上比較好的方法,它做了一點(diǎn)“手腳”使得特征值的實(shí)部盡量為負(fù)數(shù)。先考慮一般的形式:

其中, γ 大于0,A為可逆矩陣,表達(dá)式為:

嚴(yán)謹(jǐn)起見(jiàn),需要說(shuō)明一下:如果某個(gè)x是

的一個(gè)不動(dòng)點(diǎn),則該x也是

的不動(dòng)點(diǎn),這里并沒(méi)有因?yàn)樵谑阶又刑砑覣(x)而影響了不動(dòng)點(diǎn),之前可能在哪里收斂,之后還是可能在那個(gè)點(diǎn)收斂。而且在該不動(dòng)點(diǎn),

可以看出,相比于第3部分的表達(dá)式,新增加的一項(xiàng)會(huì)使得特征值向?qū)崝?shù)部的負(fù)數(shù)方向偏移(新增項(xiàng)為負(fù)定矩陣,其特征值必然為負(fù)實(shí)數(shù)),如圖所示

如果超參數(shù)γ設(shè)置比較合理,“有希望”保證特征值均落在單位圓內(nèi)。

現(xiàn)在,我們將上述方式對(duì)接到GAN中,將生成器和判別器的目標(biāo)函數(shù)修改為:

其中,?

可以寫成如下形式:

化簡(jiǎn)可有:

其雅可比矩陣的表達(dá)式為:

根據(jù)之前的結(jié)論,如果γ設(shè)置比較合理,學(xué)習(xí)速率h足夠小,則其特征值均會(huì)落入單位圓內(nèi),參數(shù)隨著不斷更新迭代會(huì)進(jìn)入不動(dòng)點(diǎn),也就是說(shuō)進(jìn)入納什均衡的狀態(tài)。添加的正則項(xiàng)雖然沒(méi)有解決要求足夠小的學(xué)習(xí)速率的問(wèn)題,但是“保證”了特征值盡可能落入單位圓中。

最后說(shuō)明一下,一般GAN中,生成器和判別器的目標(biāo)函數(shù)符號(hào)是相反的,但是我們同時(shí)對(duì)它們?cè)黾酉嗤?hào)的正則項(xiàng),在正則項(xiàng)部分上,它們的優(yōu)化目標(biāo)是一致的,故稱之為一致優(yōu)化。

[1]?Mescheder L , Nowozin S , Geiger A . The Numerics of GANs[J]. 2017.

[2]?Nagarajan V, Kolter J Z, Nagarajan V, et al. Gradient descent GAN optimization is locally stable[J]. 2017.

總結(jié)

這篇文章承接上一篇文章,在GAN中利用動(dòng)力學(xué)的成熟知識(shí),添加了一個(gè)正則項(xiàng),保證了GAN在足夠小的學(xué)習(xí)速率的情況下能收斂進(jìn)入納什均衡狀態(tài),是一項(xiàng)非常有價(jià)值的工作。下一期的任務(wù)將繼續(xù)延此路線展開(kāi)。

下期預(yù)告:GAN訓(xùn)練中的正則項(xiàng)

GAN群

有三AI建立了一個(gè)GAN群,便于有志者相互交流。感興趣的同學(xué)也可以微信搜索xiaozhouguo94,備注"加入有三-GAN群"。

有三AI夏季劃

有三AI夏季劃進(jìn)行中,歡迎了解并加入,系統(tǒng)性成長(zhǎng)為中級(jí)CV算法工程師。

轉(zhuǎn)載文章請(qǐng)后臺(tái)聯(lián)系

侵權(quán)必究

往期精選

  • 【GAN優(yōu)化】GAN優(yōu)化專欄上線,首談生成模型與GAN基礎(chǔ)

  • 【GAN的優(yōu)化】從KL和JS散度到fGAN

  • 【GAN優(yōu)化】詳解對(duì)偶與WGAN

  • 【GAN優(yōu)化】詳解SNGAN(頻譜歸一化GAN)

  • 【GAN優(yōu)化】一覽IPM框架下的各種GAN

  • 【GAN優(yōu)化】GAN優(yōu)化專欄欄主小米粥自述,腳踏實(shí)地,莫問(wèn)前程

  • 【GAN優(yōu)化】GAN訓(xùn)練的幾個(gè)問(wèn)題

  • 【GAN優(yōu)化】GAN訓(xùn)練的小技巧

  • 【GAN優(yōu)化】從動(dòng)力學(xué)視角看GAN是一種什么感覺(jué)?

  • 【技術(shù)綜述】有三說(shuō)GANs(上)

  • 【模型解讀】歷數(shù)GAN的5大基本結(jié)構(gòu)

總結(jié)

以上是生活随笔為你收集整理的【GAN优化】详解GAN中的一致优化问题的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。