當(dāng)前位置：首頁(yè) > 人工智能 > pytorch >内容正文

pytorch

CVPR 2022上人脸识别相关的论文分类整理

發(fā)布時(shí)間：2024/3/24 pytorch 109 豆豆

生活随笔收集整理的這篇文章主要介紹了 CVPR 2022上人脸识别相关的论文分类整理小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

人臉識(shí)別是AI研究的一個(gè)重要的方向，CVPR 2022也有很多相關(guān)的論文，本篇文章將針對(duì)不同的應(yīng)用分類進(jìn)行整理，希望對(duì)你有幫助

人臉識(shí)別

人臉識(shí)是一個(gè)熱門(mén)話題，在當(dāng)前的基準(zhǔn)測(cè)試中要以相當(dāng)大的提升擊敗現(xiàn)有的SOTA模型變得越來(lái)越困難。

越來(lái)越多的開(kāi)放數(shù)據(jù)可以用于訓(xùn)練，在百萬(wàn)級(jí)規(guī)模的數(shù)據(jù)上進(jìn)行訓(xùn)練的一個(gè)主要問(wèn)題是：最終的全連接層隨著身份的數(shù)量線性擴(kuò)展，會(huì)導(dǎo)致每次迭代時(shí)內(nèi)存占用巨大并且反向傳播時(shí)非常慢。一種旨在緩解這種情況的方法是 Partial FC [2]（在今年CVPR上發(fā)表之前就已經(jīng)非常流行了）它已經(jīng)包含在insightface的repo中。該方法試圖逼近現(xiàn)在標(biāo)準(zhǔn)的訓(xùn)練人臉識(shí)別方法(如CosFace、ArcFace等)的最后一層。為了達(dá)到更好的縮放人臉識(shí)別的目的，Wang等人(來(lái)自阿里巴巴)的方法[3]使用名為動(dòng)態(tài)分類池（Dynamic Class Pool）的來(lái)替代最后的FC層，并通過(guò)更好的數(shù)據(jù)加載器進(jìn)行了進(jìn)一步的改進(jìn)(見(jiàn)下圖)。

另外兩篇關(guān)于人臉識(shí)別的論文:He at al. [4]試圖將深度和反照率從人臉圖像中分離出來(lái),提高使用 3D 信息的識(shí)別能力。它通過(guò)引入帶有兩個(gè)輔助網(wǎng)絡(luò)的 3D 人臉重建損失來(lái)實(shí)現(xiàn)這一點(diǎn)。現(xiàn)在又很多方法都在試圖將面部整合成 3D 信息(NeRF的論文中也看到相同的內(nèi)容)。Phan和Nguyen的[5]方法也可以在重度遮擋人臉(太陽(yáng)鏡、口罩等)的人臉圖片上驗(yàn)證，而且不需要對(duì)模型進(jìn)行再訓(xùn)練。

[4] 使用人臉的 3D 重建來(lái)改善人臉識(shí)別。

[5] 提出了一種巧妙的方法來(lái)使用未被遮擋的面部部分進(jìn)行面部驗(yàn)證（它不會(huì)重新訓(xùn)練模型）。

減少偏置

今年在CVPR上看到了很多減少偏置的方法，很多論文都提出了不需要大量的注釋數(shù)據(jù)來(lái)顯著減輕偏置。

Liu和Yu[9]首先定義了一種新的人臉識(shí)別訓(xùn)練的邊際損失，它使用了幾種偏置因素的組合，如種族、姿勢(shì)、模糊和遮擋。他們的方法也使用了一些長(zhǎng)尾方法進(jìn)行訓(xùn)練(學(xué)習(xí)如何學(xué)習(xí))。

Jung, Chun和Moon[10]的“Learning Fair Classifiers with Partially Annotated Group Labels”提出，當(dāng)只有一小部分?jǐn)?shù)據(jù)集有敏感組標(biāo)簽的標(biāo)注時(shí)，當(dāng)前的公平分類方法的性能比從頭訓(xùn)練差。然后作者提出了一種方法：可以通過(guò)只對(duì)一小部分組數(shù)據(jù)進(jìn)行標(biāo)注來(lái)提高公平性——在他們的實(shí)驗(yàn)中，只有 10% 就足夠了。。

Wang等人[11]的研究更進(jìn)一步，提出了一種無(wú)需再訓(xùn)練就能減輕已部署模型偏差的方法。它使用了那些在十年前流行的對(duì)抗性擾動(dòng)，表明只需要添加一個(gè)看起來(lái)是隨機(jī)的噪聲(這在視覺(jué)上不會(huì)影響人類的圖像)，就可以在分類器中很容易改變圖像的一個(gè)類別。論文中他們?cè)噲D找到這個(gè)擾動(dòng)，來(lái)糾正似乎來(lái)自模型偏差的誤差。

活體檢測(cè)

Dhar et al. [6] 提出了一種基于知識(shí)蒸餾的巧妙方法，將識(shí)別和活體檢測(cè)數(shù)據(jù)集結(jié)合在單個(gè)多任務(wù)網(wǎng)絡(luò)中，用于人眼認(rèn)證和演示攻擊檢測(cè)。當(dāng)沒(méi)有標(biāo)注的活體檢測(cè)數(shù)據(jù)集中的人的身份時(shí)這種方法是非常好的。

Wang et al. [7] 在人臉中獲取隨機(jī)補(bǔ)丁并應(yīng)用類似于 arcface 的損失，來(lái)創(chuàng)建簇見(jiàn)距離的圖像特征，他們通過(guò)演示媒體和相機(jī)質(zhì)量來(lái)區(qū)分PS圖像。

人臉偽造識(shí)別

目前在認(rèn)證系統(tǒng)中經(jīng)常出現(xiàn)的一種欺詐是人臉的偽造(deepfake)，通過(guò)偽造人臉可以繞過(guò)檢測(cè)系統(tǒng)。

Shiohara和Yamasaki[12]提出了一種方法，通過(guò)使用同一個(gè)人作為源圖像和目標(biāo)圖像(他們稱之為自混合圖像)，使deepfake變得更加困難。

Jia et al [13] 提出了一種創(chuàng)建對(duì)抗性攻擊的方法，不僅在基于空間的檢測(cè)器中有效，而且在基于頻率的檢測(cè)器中也有效。

人臉重建

人臉重建的目的是從低質(zhì)量的人臉圖像中重建出高質(zhì)量的人臉圖像。在

Zhu et al. [14]（騰訊）利用3D信息來(lái)引導(dǎo)形狀并與生成先驗(yàn)整合來(lái)進(jìn)行人臉重建。論文的結(jié)果表明，與SOTA相比，該方法在重建真實(shí)人臉?lè)矫姹憩F(xiàn)得相當(dāng)好，但從論文的圖像樣本中可以清楚地看出，有時(shí)人的身份特征丟失了——這意味著，重建的圖像，即使是真實(shí)的人臉，它看起來(lái)也不是原始圖像中的同一個(gè)人。

Zhao等人發(fā)表了一篇非常有趣的論文，題為“Rethinking Deep Face Restoration”[15]，正好闡述了類似上面論文產(chǎn)生的身份丟失的問(wèn)題。他們將人臉修復(fù)問(wèn)題分為人臉生成和人臉重建兩個(gè)方面。通過(guò)單獨(dú)解決每個(gè)問(wèn)題，并在兩個(gè)階段提出改進(jìn)，可以大大改善結(jié)果。他們還提出了一個(gè)新的衡量標(biāo)準(zhǔn)來(lái)評(píng)估在重建過(guò)程中保留了多少身份特征。這是第一篇以這種方式評(píng)估重建的論文。這樣看，這個(gè)領(lǐng)域?qū)⑷绾伟l(fā)展，以及是否有可能在人臉識(shí)別之前使用這些方法還是可以有巨大的進(jìn)步的。

NeRF - 神經(jīng)輻射場(chǎng)

NeRF 仍然是本次 CVPR 中的熱門(mén)話題，基本上 NeRF 是一個(gè)生成模型，它使用來(lái)自不同視點(diǎn)的對(duì)象圖片進(jìn)行訓(xùn)練。經(jīng)過(guò)訓(xùn)練模型就能夠生成場(chǎng)景的新視點(diǎn)。

今年CVPR最佳學(xué)生論文榮譽(yù)獎(jiǎng)被授予 Verbin 等人的工作 [16]。他們的方法找到了一種改善 NeRF 鏡面反射的方法（演示也很出彩）。盡管沒(méi)有用于面部生物識(shí)別，但 NeRF 被大量用于參數(shù)化面部/頭部。

Athar et al. [17]的工作結(jié)合了非常常見(jiàn)的人臉 3D 參數(shù)化 (3DMM) 和 NeRF。由此產(chǎn)生的系統(tǒng)能夠使用顯式參數(shù)來(lái)改變頭部姿勢(shì)和表情。也可以使用視頻作為輸入，并且他們也提供了視頻的演示。

最后，Rebain等人的一篇論文[18]（谷歌）似乎改變了nerf的游戲規(guī)則，它被稱為“LOLNeRF: Learn from One Look”。顧名思義，它們?cè)O(shè)法從大量單視圖圖像集合中學(xué)習(xí)形狀和外觀表示，有興趣的可以看看他們提供的DEMO。

總結(jié)

以上就是CVPR 2022上可能和人臉識(shí)別相關(guān)的論文總結(jié)，我在下面也提供了各個(gè)論文的引用，請(qǐng)按需查看：

1] — Kim, M., Jain, A. K., & Liu, X. (2022). AdaFace: Quality Adaptive Margin for Face Recognition. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 18750–18759).

[2] — An, X., Deng, J., Guo, J., Feng, Z., Zhu, X., Yang, J., & Liu, T. (2022). Killing Two Birds with One Stone: Efficient and Robust Training of Face Recognition CNNs by Partial FC. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4042–4051).

[3] — Wang, K., Wang, S., Zhang, P., Zhou, Z., Zhu, Z., Wang, X., … & You, Y. (2022). An efficient training approach for very large scale face recognition. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4083–4092).

[4] — He, M., Zhang, J., Shan, S., & Chen, X. (2022). Enhancing Face Recognition With Self-Supervised 3D Reconstruction. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4062–4071).

[5] — Phan, H., & Nguyen, A. (2022). DeepFace-EMD: Re-Ranking Using Patch-Wise Earth Mover’s Distance Improves Out-of-Distribution Face Identification. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 20259–20269).

[6] — Dhar, P., Kumar, A., Kaplan, K., Gupta, K., Ranjan, R., & Chellappa, R. (2022). EyePAD++: A Distillation-based approach for joint Eye Authentication and Presentation Attack Detection using Periocular Images. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 20218–20227).

[7] — Wang, C. Y., Lu, Y. D., Yang, S. T., & Lai, S. H. (2022). PatchNet: A Simple Face Anti-Spoofing Framework via Fine-Grained Patch Recognition. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 20281–20290).

[8] — Wang, Z., Wang, Z., Yu, Z., Deng, W., Li, J., Gao, T., & Wang, Z. (2022). Domain Generalization via Shuffled Style Assembly for Face Anti-Spoofing. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4123–4133).

[9] — Liu, C., Yu, X., Tsai, Y. H., Faraki, M., Moslemi, R., Chandraker, M., & Fu, Y. (2022). Learning to Learn across Diverse Data Biases in Deep Face Recognition. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4072–4082).

[10] — Jung, S., Chun, S., & Moon, T. (2022). Learning Fair Classifiers with Partially Annotated Group Labels. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 10348–10357).

[11] — Wang, Z., Dong, X., Xue, H., Zhang, Z., Chiu, W., Wei, T., & Ren, K. (2022). Fairness-aware Adversarial Perturbation Towards Bias Mitigation for Deployed Deep Models. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 10379–10388).

[12] — Shiohara, K., & Yamasaki, T. (2022). Detecting Deepfakes with Self-Blended Images. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 18720–18729).

[13] — Jia, S., Ma, C., Yao, T., Yin, B., Ding, S., & Yang, X. (2022). Exploring Frequency Adversarial Attacks for Face Forgery Detection. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4103–4112).

[14] — Zhu, F., Zhu, J., Chu, W., Zhang, X., Ji, X., Wang, C., & Tai, Y. (2022). Blind Face Restoration via Integrating Face Shape and Generative Priors. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 7662–7671).

[15] — Zhao, Yang, Yu-Chuan Su, Chun-Te Chu, Yandong Li, Marius Renn, Yukun Zhu, Changyou Chen, and Xuhui Jia. “Rethinking Deep Face Restoration.” In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, pp. 7652–7661. 2022.Neural Radiance Fields (NeRFs)

[16] — Verbin, D., Hedman, P., Mildenhall, B., Zickler, T., Barron, J. T., & Srinivasan, P. P. (2021). Ref-nerf: Structured view-dependent appearance for neural radiance fields. arXiv preprint arXiv:2112.03907.

[17] — Athar, S., Xu, Z., Sunkavalli, K., Shechtman, E., & Shu, Z. (2022). RigNeRF: Fully Controllable Neural 3D Portraits. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 20364–20373).

[18] — Rebain, D., Matthews, M., Yi, K. M., Lagun, D., & Tagliasacchi, A. (2022). LOLNeRF: Learn from One Look. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 1558–1567).

https://avoid.overfit.cn/post/9c15fe50f63e48739e2e8c1f40b5c76c

作者：Gustavo Führ

總結(jié)

以上是生活随笔為你收集整理的CVPR 2022上人脸识别相关的论文分类整理的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：山东省2022 年专升本计算机大纲（计
下一篇：深度学习入门（五十二）计算机视觉——风格

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

pytorch

CVPR 2022上人脸识别相关的论文分类整理

人臉識(shí)別

減少偏置

活體檢測(cè)

人臉偽造識(shí)別

人臉重建

NeRF - 神經(jīng)輻射場(chǎng)

總結(jié)

總結(jié)