日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人工智能 > ChatGpt >内容正文

ChatGpt

【杂谈】有三AI知识星球最近都GAN了哪些内容?

發布時間:2025/3/20 ChatGpt 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【杂谈】有三AI知识星球最近都GAN了哪些内容? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

歡迎大家來到《知識星球》專欄,有三AI知識星球GAN已經更新了好一段時間了,那么最近這一個月主要是在更新什么內容呢,下面簡單的介紹一下。

作者&編輯 | 言有三

1 GAN與人臉年齡編輯

跨年齡的人臉識別和驗證是一個非常具有挑戰性的問題,如果能對年齡進行歸一化,去除年齡因素的干擾,將大大提升跨年齡人臉識別的精度。

有三AI知識星球-網絡結構1000變

CAAE

CAAE(Conditional Adversarial Autoencoder)是一個年齡編輯模型,它可以估計年齡變大時的人臉(Age Progression),也可以估計年齡較小時的人臉(Age Regression)。

作者/編輯 言有三

CAAE模型首先假設人臉圖像處于一種高維流形(high-dimensional manifold)中,當圖像在這個流形中沿著某個特定方向移動時,年齡就會隨著發生變化,如下圖。

圖中點表示的就是各個年齡,而虛線軌跡就是自然的變化方向,不過在高維流形中操作人臉圖像是一件非常困難的事情,我們無法直接描繪上述的軌跡。

因此與大部分生成模型的思路一樣,首先需要將圖像映射到低維的latent space,實際上就是一個低維的向量,最后再把處理后的低維向量映射回到高維流形中。這兩次映射分別由Encoder和Generator實現,如下:

Encoder輸入圖像輸出z,之后與年齡標簽向量進行拼接作為G的輸入。判別器包含兩個,一個是Dimg,一個是Dz。年齡標簽向量填充后與人臉圖進行通道拼接輸入到判別器Dimg,該判別器判別生成圖的真實性,包含若干個卷積層和若干個全連接層。Dz用于約束z的均勻分布,它包含若干個全連接層。

使用開源代碼https://github.com/mattans/AgeProgression,訓練結果如下。

上面的成對圖中左側是生成圖,右側是原圖,可以看到正面人臉圖像效果是非常好的。

參考文獻

[1]?Zhang Z, Song Y, Qi H. Age progression/regression by conditional adversarial autoencoder[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017: 5810-5818..

2 GAN與人臉表情編輯

表情與年齡一樣,也會對人臉識別算法構成一定挑戰,年齡和表情編輯同時還是一個兼具娛樂性的應用方向,GAN在其中大有可為。

有三AI知識星球-網絡結構1000變

G2-GAN

Geometry Guided Adversarial Facial Expression Synthesis中提出了一個基于關鍵點的表情編輯GAN,它將人臉關鍵點的熱圖作為條件來控制表情的生成與去除。

作者/編輯 言有三

該模型包括兩個生成器和兩個判別器。生成器GE是一個表情生成器,輸入帶表情的關鍵點熱圖HE和無表情的正臉圖IN,生成有表情的圖IE。生成器GN則相反,輸入帶表情的關鍵點熱圖HE和有表情的正臉圖IE,生成無表情的圖IN。

判別器D用于判別真實的三元組(I,H,I’)和生成的三元組(I,H,G(I)),其中I和I’代表的就是無表情和有表情的圖。DE中I是無表情圖,I’是有表情圖,DN中則反之。

整體的損失函數包括4部分:

第一部分是標準的GAN損失,包括生成器損失和判別器損失。

第二部分是pixel loss,用于約束生成器的圖與輸入圖的像素平滑。

第三部分是cycles損失,從輸入圖到GE,到經過GN,構成了一個閉環。

第四部分是屬性保持損失,用于約束身份信息不會被更改,如下式,其中F表示的是人臉識別的特征提取器。

下面是它在CK+表情數據集上的結果。

第一排是無表情,第二排是有表情,第三排是去除表情,第四排是仿真的表情。

上圖是不同表情的插值結果,第一列是原圖,后面的列是不同幅度的表情,實驗結果充分驗證了本方法的有效性。

參考文獻

[1] Song L, Lu Z, He R, et al. Geometry guided adversarial facial expression synthesis[C]//2018 ACM Multimedia Conference on Multimedia Conference. ACM, 2018: 627-635.

3 GAN與人臉姿態編輯

姿態對人臉識別等算法的影響非常大,將GAN用于姿態仿真,比如正臉化,將非常有助于人臉識別等模型的性能提升。

有三AI知識星球-網絡結構1000變

FFGAN

FFGAN是一個人臉姿態編輯GAN,可以實現任意姿態到正臉的生成。

作者/編輯 言有三

從上圖結構可以看出,3DMM系數提供了全局的姿態信息以及低頻的細節,而輸入的大姿態圖像則提供了高頻細節,兩者結合一起輸入生成器Generator,并且使用人臉識別模型來進行身份ID信息的保持。

具體的模型結構如下:

整個損失函數包括5部分,除了人臉重建損失,全變分平滑損失,GAN的對抗損失以及人臉識別身份保持損失之外,還添加了一個人臉對稱性的約束作為對稱損失,其定義如下:

使用Multi-PIE數據集進行訓練,結果如下:

FFGAN使用了3DMM模型的系數作為條件控制,首次使用了完全正臉姿態的仿真,這也是后續很多姿態編輯GAN的基本思想。

參考文獻

[1]?Yin X, Yu X, Sohn K, et al. Towards large-pose face frontalization in the wild[C]//Proceedings of the IEEE International Conference on Computer Vision. 2017: 3990-3999.

4 GAN與人臉美顏

人臉美顏是一個由來已久的研究課題,傳統的方法多是基于濾波算法和幾何變換,可以實現磨皮美白以及臉型調整。隨著GAN的流行,更多的個性化操作變得可行,比如人臉的妝造遷移。

有三AI知識星球-網絡結構1000變

BeautyGAN

BeautyGAN是一個人臉妝造遷移算法,它不需要成對圖進行訓練,可以將一張圖的妝造風格遷移到另一張圖。

作者/編輯 言有三

如上圖是BeautyGAN的結構示意圖,它使用了CycleGAN的基本結構。生成器G包括兩個輸入,分別是無妝圖Isrc、有妝圖Iref,通過encoder、residual blocks、decoder組成的生成器得到兩個輸出,分別是上妝圖IBsrc、卸妝圖IAref。之后再通過把上妝圖IBsrc和卸妝圖IAref輸入給之前的G,重新執行一次卸妝和上妝,得到兩張重建圖Irec_src和卸妝圖Irec_ref。

BeautyGAN的關鍵在于損失函數的設計,它包含2個主要的損失項:

第一個是perceptual loss:要求上妝和卸妝都不能改變原始的人物ID信息,這里通過Perceptual loss進行約束。

第二個是循環損失(cycle consistency loss),它用于約束一張圖經過兩次G后與對應的原始圖相同,與CycleGAN的不同之處在于這里使用了同一個GAN,損失的定義是一致的,不再多說。

第三個就是直方圖匹配損失,定義如下:

直方圖匹配損失用于控制臉部、眼部、嘴部三個局部區域的效果。M是掩膜,item分別表示臉部、眼部、嘴部三個區域,HM是一個直方圖匹配操作。

使用開源代碼https://github.com/baldFemale/beautyGAN-tf-Implement進行訓練,測試結果如下:

參考文獻

[1]?Li T, Qian R, Dong C, et al. Beautygan: Instance-level facial makeup transfer with deep generative adversarial network[C]//2018 ACM Multimedia Conference on Multimedia Conference. ACM, 2018: 645-653.

5 GAN與換臉算法

換臉算法有很多種,已經從實驗室走向了工業界,甚至達到了以假亂真的效果,我們后面會給大家持續介紹。

有三AI知識星球-網絡結構1000變

Fast Face-swap

Fast Face-swap是一個基于風格遷移的換臉模型,將被換臉圖作為內容圖,換臉圖作為風格圖,實現了單張圖的人臉遷移。

作者/編輯 言有三

從上圖結構可以看出,它首先對輸入圖像進行正臉對齊,然后使用風格遷移算法將要換的臉圖進行面部紋理遷移得到結果圖,接著進行反對齊,即恢復人臉的初始姿態,最后基于人臉掩膜與原始圖像采用seamless cloning技術進行融合改進。

具體的網絡結構如上,采用了多尺度的結構,內容的損失就是標準的L2距離。

風格的損失使用了多個K*K大小的圖像塊的高層特征向量的余弦距離,如下:

文章中還添加了一個光照損失,通過在同一姿態不同光照條件下訓練的Siamese模型來提取特征,然后計算其歐式距離。

完整的實現可以參考眾多的風格遷移模型,一些結構如下:

可以看出正臉的換臉效果還是不錯的。

參考文獻

[1]?Korshunova I, Shi W, Dambre J, et al.?Fast face-swap using convolutional neural networks[C]//Proceedings of the IEEE International Conference on Computer Vision. 2017: 3677-3685.

6 關于更多GAN的內容

有三AI知識星球是我們繼公眾號之后重點打造的原創知識學習社區,目前的網絡結構1000變板塊正在更新GAN相關的內容,有需要的同學可以加入學習。

其他的內容板塊如下,了解可以閱讀:【雜談】為什么邀請大家加入硬核知識星球有三AI

以上所有內容

加入有三AI知識星球即可獲取

來日方長

點擊加入

不見不散

更多精彩

每日更新

轉載文章請后臺聯系

侵權必究

往期精選

  • 【知識星球】分組卷積最新進展,全自動學習的分組有哪些經典模型?

  • 【知識星球】卷積核和感受野可動態分配的分組卷積

  • 【知識星球】有三AI 10月新主題,千奇百怪GAN上線!

  • 【知識星球】剪枝量化初完結,蒸餾學習又上線

  • 【知識星球】有沒有網絡模型是動態變化的,每次用的時候都不一樣?

總結

以上是生活随笔為你收集整理的【杂谈】有三AI知识星球最近都GAN了哪些内容?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。