當前位置：首頁 > 人工智能 > ChatGpt >内容正文

ChatGpt

【杂谈】有三AI知识星球最近都GAN了哪些内容？

發布時間：2025/3/20 ChatGpt 46 豆豆

生活随笔收集整理的這篇文章主要介紹了【杂谈】有三AI知识星球最近都GAN了哪些内容？小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

歡迎大家來到《知識星球》專欄，有三AI知識星球GAN已經更新了好一段時間了，那么最近這一個月主要是在更新什么內容呢，下面簡單的介紹一下。

作者&編輯 | 言有三

1 GAN與人臉年齡編輯

跨年齡的人臉識別和驗證是一個非常具有挑戰性的問題，如果能對年齡進行歸一化，去除年齡因素的干擾，將大大提升跨年齡人臉識別的精度。

有三AI知識星球-網絡結構1000變

CAAE

CAAE(Conditional Adversarial Autoencoder)是一個年齡編輯模型，它可以估計年齡變大時的人臉(Age Progression)，也可以估計年齡較小時的人臉(Age Regression)。

作者/編輯言有三

CAAE模型首先假設人臉圖像處于一種高維流形(high-dimensional manifold)中，當圖像在這個流形中沿著某個特定方向移動時，年齡就會隨著發生變化，如下圖。

圖中點表示的就是各個年齡，而虛線軌跡就是自然的變化方向，不過在高維流形中操作人臉圖像是一件非常困難的事情，我們無法直接描繪上述的軌跡。

因此與大部分生成模型的思路一樣，首先需要將圖像映射到低維的latent space，實際上就是一個低維的向量，最后再把處理后的低維向量映射回到高維流形中。這兩次映射分別由Encoder和Generator實現，如下：

Encoder輸入圖像輸出z，之后與年齡標簽向量進行拼接作為G的輸入。判別器包含兩個，一個是Dimg，一個是Dz。年齡標簽向量填充后與人臉圖進行通道拼接輸入到判別器Dimg，該判別器判別生成圖的真實性，包含若干個卷積層和若干個全連接層。Dz用于約束z的均勻分布，它包含若干個全連接層。

使用開源代碼https://github.com/mattans/AgeProgression，訓練結果如下。

上面的成對圖中左側是生成圖，右側是原圖，可以看到正面人臉圖像效果是非常好的。

參考文獻

[1]?Zhang Z, Song Y, Qi H. Age progression/regression by conditional adversarial autoencoder[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017: 5810-5818..

2 GAN與人臉表情編輯

表情與年齡一樣，也會對人臉識別算法構成一定挑戰，年齡和表情編輯同時還是一個兼具娛樂性的應用方向，GAN在其中大有可為。

有三AI知識星球-網絡結構1000變

G2-GAN

Geometry Guided Adversarial Facial Expression Synthesis中提出了一個基于關鍵點的表情編輯GAN，它將人臉關鍵點的熱圖作為條件來控制表情的生成與去除。

作者/編輯言有三

該模型包括兩個生成器和兩個判別器。生成器GE是一個表情生成器，輸入帶表情的關鍵點熱圖HE和無表情的正臉圖IN，生成有表情的圖IE。生成器GN則相反，輸入帶表情的關鍵點熱圖HE和有表情的正臉圖IE，生成無表情的圖IN。

判別器D用于判別真實的三元組(I,H,I’)和生成的三元組(I,H,G(I))，其中I和I’代表的就是無表情和有表情的圖。DE中I是無表情圖，I’是有表情圖，DN中則反之。

整體的損失函數包括4部分：

第一部分是標準的GAN損失，包括生成器損失和判別器損失。

第二部分是pixel loss，用于約束生成器的圖與輸入圖的像素平滑。

第三部分是cycles損失，從輸入圖到GE，到經過GN，構成了一個閉環。

第四部分是屬性保持損失，用于約束身份信息不會被更改，如下式，其中F表示的是人臉識別的特征提取器。

下面是它在CK+表情數據集上的結果。

第一排是無表情，第二排是有表情，第三排是去除表情，第四排是仿真的表情。

上圖是不同表情的插值結果，第一列是原圖，后面的列是不同幅度的表情，實驗結果充分驗證了本方法的有效性。

參考文獻

[1] Song L, Lu Z, He R, et al. Geometry guided adversarial facial expression synthesis[C]//2018 ACM Multimedia Conference on Multimedia Conference. ACM, 2018: 627-635.

3 GAN與人臉姿態編輯

姿態對人臉識別等算法的影響非常大，將GAN用于姿態仿真，比如正臉化，將非常有助于人臉識別等模型的性能提升。

有三AI知識星球-網絡結構1000變

FFGAN

FFGAN是一個人臉姿態編輯GAN，可以實現任意姿態到正臉的生成。

作者/編輯言有三

從上圖結構可以看出，3DMM系數提供了全局的姿態信息以及低頻的細節，而輸入的大姿態圖像則提供了高頻細節，兩者結合一起輸入生成器Generator，并且使用人臉識別模型來進行身份ID信息的保持。

具體的模型結構如下：

整個損失函數包括5部分，除了人臉重建損失，全變分平滑損失，GAN的對抗損失以及人臉識別身份保持損失之外，還添加了一個人臉對稱性的約束作為對稱損失，其定義如下：

使用Multi-PIE數據集進行訓練，結果如下：

FFGAN使用了3DMM模型的系數作為條件控制，首次使用了完全正臉姿態的仿真，這也是后續很多姿態編輯GAN的基本思想。

參考文獻

[1]?Yin X, Yu X, Sohn K, et al. Towards large-pose face frontalization in the wild[C]//Proceedings of the IEEE International Conference on Computer Vision. 2017: 3990-3999.

4 GAN與人臉美顏

人臉美顏是一個由來已久的研究課題，傳統的方法多是基于濾波算法和幾何變換，可以實現磨皮美白以及臉型調整。隨著GAN的流行，更多的個性化操作變得可行，比如人臉的妝造遷移。

有三AI知識星球-網絡結構1000變

BeautyGAN

BeautyGAN是一個人臉妝造遷移算法，它不需要成對圖進行訓練，可以將一張圖的妝造風格遷移到另一張圖。

作者/編輯言有三

如上圖是BeautyGAN的結構示意圖，它使用了CycleGAN的基本結構。生成器G包括兩個輸入，分別是無妝圖Isrc、有妝圖Iref，通過encoder、residual blocks、decoder組成的生成器得到兩個輸出，分別是上妝圖IBsrc、卸妝圖IAref。之后再通過把上妝圖IBsrc和卸妝圖IAref輸入給之前的G，重新執行一次卸妝和上妝，得到兩張重建圖Irec_src和卸妝圖Irec_ref。

BeautyGAN的關鍵在于損失函數的設計，它包含2個主要的損失項：

第一個是perceptual loss：要求上妝和卸妝都不能改變原始的人物ID信息，這里通過Perceptual loss進行約束。

第二個是循環損失(cycle consistency loss)，它用于約束一張圖經過兩次G后與對應的原始圖相同，與CycleGAN的不同之處在于這里使用了同一個GAN，損失的定義是一致的，不再多說。

第三個就是直方圖匹配損失，定義如下：

直方圖匹配損失用于控制臉部、眼部、嘴部三個局部區域的效果。M是掩膜，item分別表示臉部、眼部、嘴部三個區域，HM是一個直方圖匹配操作。

使用開源代碼https://github.com/baldFemale/beautyGAN-tf-Implement進行訓練，測試結果如下：

參考文獻

[1]?Li T, Qian R, Dong C, et al. Beautygan: Instance-level facial makeup transfer with deep generative adversarial network[C]//2018 ACM Multimedia Conference on Multimedia Conference. ACM, 2018: 645-653.

5 GAN與換臉算法

換臉算法有很多種，已經從實驗室走向了工業界，甚至達到了以假亂真的效果，我們后面會給大家持續介紹。

有三AI知識星球-網絡結構1000變

Fast Face-swap

Fast Face-swap是一個基于風格遷移的換臉模型，將被換臉圖作為內容圖，換臉圖作為風格圖，實現了單張圖的人臉遷移。

作者/編輯言有三

從上圖結構可以看出，它首先對輸入圖像進行正臉對齊，然后使用風格遷移算法將要換的臉圖進行面部紋理遷移得到結果圖，接著進行反對齊，即恢復人臉的初始姿態，最后基于人臉掩膜與原始圖像采用seamless cloning技術進行融合改進。

具體的網絡結構如上，采用了多尺度的結構，內容的損失就是標準的L2距離。

風格的損失使用了多個K*K大小的圖像塊的高層特征向量的余弦距離，如下：

文章中還添加了一個光照損失，通過在同一姿態不同光照條件下訓練的Siamese模型來提取特征，然后計算其歐式距離。

完整的實現可以參考眾多的風格遷移模型，一些結構如下：

可以看出正臉的換臉效果還是不錯的。

參考文獻

[1]?Korshunova I, Shi W, Dambre J, et al.?Fast face-swap using convolutional neural networks[C]//Proceedings of the IEEE International Conference on Computer Vision. 2017: 3677-3685.

6 關于更多GAN的內容

有三AI知識星球是我們繼公眾號之后重點打造的原創知識學習社區，目前的網絡結構1000變板塊正在更新GAN相關的內容，有需要的同學可以加入學習。

其他的內容板塊如下，了解可以閱讀：【雜談】為什么邀請大家加入硬核知識星球有三AI

以上所有內容

加入有三AI知識星球即可獲取

來日方長

點擊加入

不見不散

更多精彩

每日更新

轉載文章請后臺聯系

侵權必究

往期精選

【知識星球】分組卷積最新進展，全自動學習的分組有哪些經典模型？
【知識星球】卷積核和感受野可動態分配的分組卷積
【知識星球】有三AI 10月新主題，千奇百怪GAN上線！
【知識星球】剪枝量化初完結，蒸餾學習又上線
【知識星球】有沒有網絡模型是動態變化的，每次用的時候都不一樣？

總結

以上是生活随笔為你收集整理的【杂谈】有三AI知识星球最近都GAN了哪些内容？的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【杂谈】当前模型剪枝有哪些可用的开源工具
下一篇：【年终总结】2019年有三AI NLP做

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

ChatGpt

【杂谈】有三AI知识星球最近都GAN了哪些内容？

總結