CVPR 2022上人脸识别相关的论文分类整理
人臉識(shí)別是AI研究的一個(gè)重要的方向,CVPR 2022也有很多相關(guān)的論文,本篇文章將針對(duì)不同的應(yīng)用分類進(jìn)行整理,希望對(duì)你有幫助
人臉識(shí)別
人臉識(shí)是一個(gè)熱門(mén)話題,在當(dāng)前的基準(zhǔn)測(cè)試中要以相當(dāng)大的提升擊敗 現(xiàn)有的SOTA模型變得越來(lái)越困難。
越來(lái)越多的開(kāi)放數(shù)據(jù)可以用于訓(xùn)練,在百萬(wàn)級(jí)規(guī)模的數(shù)據(jù)上進(jìn)行訓(xùn)練的一個(gè)主要問(wèn)題是:最終的全連接層隨著身份的數(shù)量線性擴(kuò)展,會(huì)導(dǎo)致每次迭代時(shí)內(nèi)存占用巨大并且反向傳播時(shí)非常慢。一種旨在緩解這種情況的方法是 Partial FC [2](在今年CVPR上發(fā)表之前就已經(jīng)非常流行了)它已經(jīng)包含在insightface的repo中。該方法試圖逼近現(xiàn)在標(biāo)準(zhǔn)的訓(xùn)練人臉識(shí)別方法(如CosFace、ArcFace等)的最后一層。為了達(dá)到更好的縮放人臉識(shí)別的目的,Wang等人(來(lái)自阿里巴巴)的方法[3]使用名為動(dòng)態(tài)分類池(Dynamic Class Pool)的來(lái)替代最后的FC層,并通過(guò)更好的數(shù)據(jù)加載器進(jìn)行了進(jìn)一步的改進(jìn)(見(jiàn)下圖)。
另外兩篇關(guān)于人臉識(shí)別的論文:He at al. [4]試圖將深度和反照率從人臉圖像中分離出來(lái),提高使用 3D 信息的識(shí)別能力。它通過(guò)引入帶有兩個(gè)輔助網(wǎng)絡(luò)的 3D 人臉重建損失來(lái)實(shí)現(xiàn)這一點(diǎn)。現(xiàn)在又很多方法都在試圖將面部整合成 3D 信息(NeRF的論文中也看到相同的內(nèi)容)。Phan和Nguyen的[5]方法也可以在重度遮擋人臉(太陽(yáng)鏡、口罩等)的人臉圖片上驗(yàn)證,而且不需要對(duì)模型進(jìn)行再訓(xùn)練。
[4] 使用人臉的 3D 重建來(lái)改善人臉識(shí)別。
[5] 提出了一種巧妙的方法來(lái)使用未被遮擋的面部部分進(jìn)行面部驗(yàn)證(它不會(huì)重新訓(xùn)練模型)。
減少偏置
今年在CVPR上看到了很多減少偏置的方法,很多論文都提出了不需要大量的注釋數(shù)據(jù)來(lái)顯著減輕偏置。
Liu和Yu[9]首先定義了一種新的人臉識(shí)別訓(xùn)練的邊際損失,它使用了幾種偏置因素的組合,如種族、姿勢(shì)、模糊和遮擋。他們的方法也使用了一些長(zhǎng)尾方法進(jìn)行訓(xùn)練(學(xué)習(xí)如何學(xué)習(xí))。
Jung, Chun和Moon[10]的“Learning Fair Classifiers with Partially Annotated Group Labels”提出,當(dāng)只有一小部分?jǐn)?shù)據(jù)集有敏感組標(biāo)簽的標(biāo)注時(shí),當(dāng)前的公平分類方法的性能比從頭訓(xùn)練差。然后作者提出了一種方法:可以通過(guò)只對(duì)一小部分組數(shù)據(jù)進(jìn)行標(biāo)注來(lái)提高公平性——在他們的實(shí)驗(yàn)中,只有 10% 就足夠了。。
Wang等人[11]的研究更進(jìn)一步,提出了一種無(wú)需再訓(xùn)練就能減輕已部署模型偏差的方法。它使用了那些在十年前流行的對(duì)抗性擾動(dòng),表明只需要添加一個(gè)看起來(lái)是隨機(jī)的噪聲(這在視覺(jué)上不會(huì)影響人類的圖像),就可以在分類器中很容易改變圖像的一個(gè)類別。論文中他們?cè)噲D找到這個(gè)擾動(dòng),來(lái)糾正似乎來(lái)自模型偏差的誤差。
活體檢測(cè)
Dhar et al. [6] 提出了一種基于知識(shí)蒸餾的巧妙方法,將識(shí)別和活體檢測(cè)數(shù)據(jù)集結(jié)合在單個(gè)多任務(wù)網(wǎng)絡(luò)中,用于人眼認(rèn)證和演示攻擊檢測(cè)。當(dāng)沒(méi)有標(biāo)注的活體檢測(cè)數(shù)據(jù)集中的人的身份時(shí)這種方法是非常好的。
Wang et al. [7] 在人臉中獲取隨機(jī)補(bǔ)丁并應(yīng)用類似于 arcface 的損失,來(lái)創(chuàng)建簇見(jiàn)距離的圖像特征,他們通過(guò)演示媒體和相機(jī)質(zhì)量來(lái)區(qū)分PS圖像。
人臉偽造識(shí)別
目前在認(rèn)證系統(tǒng)中經(jīng)常出現(xiàn)的一種欺詐是人臉的偽造(deepfake),通過(guò)偽造人臉可以繞過(guò)檢測(cè)系統(tǒng)。
Shiohara和Yamasaki[12]提出了一種方法,通過(guò)使用同一個(gè)人作為源圖像和目標(biāo)圖像(他們稱之為自混合圖像),使deepfake變得更加困難。
Jia et al [13] 提出了一種創(chuàng)建對(duì)抗性攻擊的方法,不僅在基于空間的檢測(cè)器中有效,而且在基于頻率的檢測(cè)器中也有效。
人臉重建
人臉重建的目的是從低質(zhì)量的人臉圖像中重建出高質(zhì)量的人臉圖像。在
Zhu et al. [14](騰訊)利用3D信息來(lái)引導(dǎo)形狀并與生成先驗(yàn)整合來(lái)進(jìn)行人臉重建。論文的結(jié)果表明,與SOTA相比,該方法在重建真實(shí)人臉?lè)矫姹憩F(xiàn)得相當(dāng)好,但從論文的圖像樣本中可以清楚地看出,有時(shí)人的身份特征丟失了——這意味著,重建的圖像,即使是真實(shí)的人臉,它看起來(lái)也不是原始圖像中的同一個(gè)人。
Zhao等人發(fā)表了一篇非常有趣的論文,題為“Rethinking Deep Face Restoration”[15],正好闡述了類似上面論文產(chǎn)生的身份丟失的問(wèn)題。他們將人臉修復(fù)問(wèn)題分為人臉生成和人臉重建兩個(gè)方面。通過(guò)單獨(dú)解決每個(gè)問(wèn)題,并在兩個(gè)階段提出改進(jìn),可以大大改善結(jié)果。他們還提出了一個(gè)新的衡量標(biāo)準(zhǔn)來(lái)評(píng)估在重建過(guò)程中保留了多少身份特征。這是第一篇以這種方式評(píng)估重建的論文。這樣看,這個(gè)領(lǐng)域?qū)⑷绾伟l(fā)展,以及是否有可能在人臉識(shí)別之前使用這些方法還是可以有巨大的進(jìn)步的。
NeRF - 神經(jīng)輻射場(chǎng)
NeRF 仍然是本次 CVPR 中的熱門(mén)話題,基本上 NeRF 是一個(gè)生成模型,它使用來(lái)自不同視點(diǎn)的對(duì)象圖片進(jìn)行訓(xùn)練。經(jīng)過(guò)訓(xùn)練模型就能夠生成場(chǎng)景的新視點(diǎn)。
今年CVPR最佳學(xué)生論文榮譽(yù)獎(jiǎng)被授予 Verbin 等人的工作 [16]。他們的方法找到了一種改善 NeRF 鏡面反射的方法(演示也很出彩)。盡管沒(méi)有用于面部生物識(shí)別,但 NeRF 被大量用于參數(shù)化面部/頭部。
Athar et al. [17]的工作結(jié)合了非常常見(jiàn)的人臉 3D 參數(shù)化 (3DMM) 和 NeRF。由此產(chǎn)生的系統(tǒng)能夠使用顯式參數(shù)來(lái)改變頭部姿勢(shì)和表情。也可以使用視頻作為輸入,并且他們也提供了視頻的演示。
最后,Rebain等人的一篇論文[18](谷歌)似乎改變了nerf的游戲規(guī)則,它被稱為“LOLNeRF: Learn from One Look”。顧名思義,它們?cè)O(shè)法從大量單視圖圖像集合中學(xué)習(xí)形狀和外觀表示,有興趣的可以看看他們提供的DEMO。
總結(jié)
以上就是CVPR 2022上可能和人臉識(shí)別相關(guān)的論文總結(jié),我在下面也提供了各個(gè)論文的引用,請(qǐng)按需查看:
1] — Kim, M., Jain, A. K., & Liu, X. (2022). AdaFace: Quality Adaptive Margin for Face Recognition. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 18750–18759).
[2] — An, X., Deng, J., Guo, J., Feng, Z., Zhu, X., Yang, J., & Liu, T. (2022). Killing Two Birds with One Stone: Efficient and Robust Training of Face Recognition CNNs by Partial FC. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4042–4051).
[3] — Wang, K., Wang, S., Zhang, P., Zhou, Z., Zhu, Z., Wang, X., … & You, Y. (2022). An efficient training approach for very large scale face recognition. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4083–4092).
[4] — He, M., Zhang, J., Shan, S., & Chen, X. (2022). Enhancing Face Recognition With Self-Supervised 3D Reconstruction. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4062–4071).
[5] — Phan, H., & Nguyen, A. (2022). DeepFace-EMD: Re-Ranking Using Patch-Wise Earth Mover’s Distance Improves Out-of-Distribution Face Identification. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 20259–20269).
[6] — Dhar, P., Kumar, A., Kaplan, K., Gupta, K., Ranjan, R., & Chellappa, R. (2022). EyePAD++: A Distillation-based approach for joint Eye Authentication and Presentation Attack Detection using Periocular Images. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 20218–20227).
[7] — Wang, C. Y., Lu, Y. D., Yang, S. T., & Lai, S. H. (2022). PatchNet: A Simple Face Anti-Spoofing Framework via Fine-Grained Patch Recognition. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 20281–20290).
[8] — Wang, Z., Wang, Z., Yu, Z., Deng, W., Li, J., Gao, T., & Wang, Z. (2022). Domain Generalization via Shuffled Style Assembly for Face Anti-Spoofing. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4123–4133).
[9] — Liu, C., Yu, X., Tsai, Y. H., Faraki, M., Moslemi, R., Chandraker, M., & Fu, Y. (2022). Learning to Learn across Diverse Data Biases in Deep Face Recognition. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4072–4082).
[10] — Jung, S., Chun, S., & Moon, T. (2022). Learning Fair Classifiers with Partially Annotated Group Labels. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 10348–10357).
[11] — Wang, Z., Dong, X., Xue, H., Zhang, Z., Chiu, W., Wei, T., & Ren, K. (2022). Fairness-aware Adversarial Perturbation Towards Bias Mitigation for Deployed Deep Models. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 10379–10388).
[12] — Shiohara, K., & Yamasaki, T. (2022). Detecting Deepfakes with Self-Blended Images. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 18720–18729).
[13] — Jia, S., Ma, C., Yao, T., Yin, B., Ding, S., & Yang, X. (2022). Exploring Frequency Adversarial Attacks for Face Forgery Detection. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 4103–4112).
[14] — Zhu, F., Zhu, J., Chu, W., Zhang, X., Ji, X., Wang, C., & Tai, Y. (2022). Blind Face Restoration via Integrating Face Shape and Generative Priors. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 7662–7671).
[15] — Zhao, Yang, Yu-Chuan Su, Chun-Te Chu, Yandong Li, Marius Renn, Yukun Zhu, Changyou Chen, and Xuhui Jia. “Rethinking Deep Face Restoration.” In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, pp. 7652–7661. 2022.Neural Radiance Fields (NeRFs)
[16] — Verbin, D., Hedman, P., Mildenhall, B., Zickler, T., Barron, J. T., & Srinivasan, P. P. (2021). Ref-nerf: Structured view-dependent appearance for neural radiance fields. arXiv preprint arXiv:2112.03907.
[17] — Athar, S., Xu, Z., Sunkavalli, K., Shechtman, E., & Shu, Z. (2022). RigNeRF: Fully Controllable Neural 3D Portraits. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 20364–20373).
[18] — Rebain, D., Matthews, M., Yi, K. M., Lagun, D., & Tagliasacchi, A. (2022). LOLNeRF: Learn from One Look. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 1558–1567).
https://avoid.overfit.cn/post/9c15fe50f63e48739e2e8c1f40b5c76c
作者:Gustavo Führ
總結(jié)
以上是生活随笔為你收集整理的CVPR 2022上人脸识别相关的论文分类整理的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 山东省2022 年专升本 计算机大纲(计
- 下一篇: 深度学习入门(五十二)计算机视觉——风格