曾刷新两项世界纪录,腾讯优图人脸检测算法 DSFD 正式开源
近年來,卷積神經(jīng)網(wǎng)絡(luò)在人臉檢測中取得了很大的成功,然而這些方法在處理人臉中多變的尺度,姿態(tài),遮擋,表情,光照等問題時依然比較困難。為此,騰訊優(yōu)圖推出名為DSFD (中文名為雙分支人臉檢測器)的全新算法,該算法在著名人臉檢測數(shù)據(jù)集上取得喜人結(jié)果,如今騰訊優(yōu)圖決定將之進行開源。
騰訊優(yōu)圖的研究員們發(fā)現(xiàn),雖然之前的人臉檢測算法大都采用深度學(xué)習(xí)模型,并在特征學(xué)習(xí)的過程中也有采用特征金字塔網(wǎng)絡(luò)(Feature Pyramid Network),但在面對遮擋、暗光、大姿態(tài)、小臉等復(fù)雜場景時,仍容易出現(xiàn)誤檢或漏檢的情況。因此,在 FPN 基礎(chǔ)上,騰訊優(yōu)圖團隊采用了 3 種不同級聯(lián)方式的空洞卷積(Dilated Convolution),設(shè)計了特征增強模塊 FEM,充分學(xué)習(xí)到了不同感受野下的人臉特征。
本文提出了一種新的方法,分別處理了人臉檢測方向的三個關(guān)鍵點,包括更好的特征學(xué)習(xí),漸進式的損失函數(shù)設(shè)計以及基于錨點分配的數(shù)據(jù)擴充:
(1)新的「特征增強」模塊(FEM:Feature Enhance Module)
FEM 在采用 Top-Down 層間信息融合的同時,在同一「感受野」內(nèi)做了更多的 enhancement。因此在 width and depth 上學(xué)習(xí)到了更有效的 context 和 semantic 信息。
(2)「分層錨點漸進」式的代價函數(shù)監(jiān)督(PLA:Progressive Anchor Loss)
模型采用 2 個層級(hierarchy),基于第一層(low-level)和第二層(high-level)的差異性,適配了不同尺寸的 anchor。在訓(xùn)練過程中,PAL 對整個模型形成了更有效的監(jiān)督。
(3)「改進的錨點匹配策略」(Improved Anchor Matching Strategy)
One-stage detector 由于在輸出層分配有密集的 anchor,anchor 與 face 匹配的好壞直接影響訓(xùn)練效果。優(yōu)圖的研究人員 data augmentation 過程中充分考慮了不同大小的 face 和各個 anchor 的關(guān)系,提出了一種新的數(shù)據(jù)擴增法。
DSFD 算法
該算法已被計算機視覺頂級會議 CVPR 2019 接收,原文《DSFD: Dual Shot Face Detector》由南京理工大學(xué)計算機科學(xué)與工程學(xué)院 PCALab 與騰訊優(yōu)圖實驗室合作完成。
在兩個著名的人臉檢測數(shù)據(jù)集 WIDER FACE 和 FDDB 的 5 個評測維度上,DSFD 算法均刷新了當(dāng)時的世界紀錄,取得了 Top1 的人臉檢測結(jié)果:
WIDER FACE 評測結(jié)果
FDDB 評測結(jié)果
為了與更多同行探討DSFD 算法的實際應(yīng)用,騰訊優(yōu)圖在近日公布了開源地址:
Github 開源地址:https://github.com/TencentYoutuResearch/FaceDetection-DSFD
據(jù)了解,目前騰訊優(yōu)圖的人臉檢測技術(shù)已在安防、金融、社交、交通等多個應(yīng)用場景落地,并在手機 QQ、微眾銀行、天天 P 圖等多個公司內(nèi)外部產(chǎn)品上進行應(yīng)用驗證。
總結(jié)
以上是生活随笔為你收集整理的曾刷新两项世界纪录,腾讯优图人脸检测算法 DSFD 正式开源的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 华为P30系列国内发布:同版本比欧洲售价
- 下一篇: 外媒:摩拜出售欧洲业务处收官阶段 估值或