近年來,卷積神經網絡在人臉檢測中取得了很大的成功,然而這些方法在處理人臉中多變的尺度,姿態(tài),遮擋,表情,光照等問題時依然比較困難。為此,騰訊優(yōu)圖推出名為DSFD(中文名為雙分支人臉檢測器)的全新算法,該算法在著名人臉檢測數(shù)據(jù)集上取得喜人結果,如今騰訊優(yōu)圖決定將之進行開源。
騰訊優(yōu)圖的研究員們發(fā)現(xiàn),雖然之前的人臉檢測算法大都采用深度學習模型,并在特征學習的過程中也有采用特征金字塔網絡(FeaturePyramidNetwork),但在面對遮擋、暗光、大姿態(tài)、小臉等復雜場景時,仍容易出現(xiàn)誤檢或漏檢的情況。因此,在FPN基礎上,騰訊優(yōu)圖團隊采用了3種不同級聯(lián)方式的空洞卷積(DilatedConvolution),設計了特征增強模塊FEM,充分學習到了不同感受野下的人臉特征。
本文提出了一種新的方法,分別處理了人臉檢測方向的三個關鍵點,包括更好的特征學習,漸進式的損失函數(shù)設計以及基于錨點分配的數(shù)據(jù)擴充:
(1)新的「特征增強」模塊(FEM:FeatureEnhanceModule)
FEM在采用Top-Down層間信息融合的同時,在同一「感受野」內做了更多的enhancement。因此在widthanddepth上學習到了更有效的context和semantic信息。
(2)「分層錨點漸進」式的代價函數(shù)監(jiān)督(PLA:ProgressiveAnchorLoss)
模型采用2個層級(hierarchy),基于第一層(low-level)和第二層(high-level)的差異性,適配了不同尺寸的anchor。在訓練過程中,PAL對整個模型形成了更有效的監(jiān)督。
(3)「改進的錨點匹配策略」(Improved Anchor Matching Strategy)
One-stagedetector由于在輸出層分配有密集的anchor,anchor與face匹配的好壞直接影響訓練效果。優(yōu)圖的研究人員dataaugmentation過程中充分考慮了不同大小的face和各個anchor的關系,提出了一種新的數(shù)據(jù)擴增法。
DSFD 算法
該算法已被計算機視覺頂級會議CVPR 2019接收,原文《DSFD:DualShotFaceDetector》由南京理工大學計算機科學與工程學院PCALab與騰訊優(yōu)圖實驗室合作完成。
在兩個著名的人臉檢測數(shù)據(jù)集WIDERFACE和FDDB的5個評測維度上,DSFD算法均刷新了當時的世界紀錄,取得了Top1的人臉檢測結果:
WIDER FACE 評測結果
FDDB 評測結果
為了與更多同行探討DSFD算法的實際應用,騰訊優(yōu)圖在近日公布了開源地址:
Github開源地址:https://github.com/TencentYoutuResearch/FaceDetection-DSFD
據(jù)了解,目前騰訊優(yōu)圖的人臉檢測技術已在安防、金融、社交、交通等多個應用場景落地,并在手機QQ、微眾銀行、天天P圖等多個公司內外部產品上進行應用驗證。
-
神經網絡
+關注
關注
42文章
4774瀏覽量
100890 -
計算機視覺
+關注
關注
8文章
1698瀏覽量
46031 -
深度學習
+關注
關注
73文章
5507瀏覽量
121272
原文標題:曾刷新兩項世界紀錄,騰訊優(yōu)圖人臉檢測算法 DSFD 正式開源
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論