在线青青,宅宅午夜亚洲精品,亚洲欧美中文v日韩v在线

隨著模型越來越深，標(biāo)注數(shù)據(jù)越來越難增加，人臉識(shí)別可能遇到瓶頸。本文來自MMLab香港中文大學(xué)-商湯科技聯(lián)合實(shí)驗(yàn)室，提出一種有監(jiān)督的Metric用于人臉聚類，來部分解決無標(biāo)注數(shù)據(jù)內(nèi)部結(jié)構(gòu)復(fù)雜、依賴特定Metric、缺乏Outlier控制，以及時(shí)間復(fù)雜度等問題。

人臉識(shí)別也許是最成功也最先到達(dá)瓶頸的深度學(xué)習(xí)應(yīng)用。在Go Deeper, MoreData，Higher Performance的思想指導(dǎo)下，模型更深了，數(shù)據(jù)卻越來越難增加。目前在人臉的公開數(shù)據(jù)集標(biāo)到了百萬級(jí)別，人臉識(shí)別百萬里挑一的正確率達(dá)到99.9％（MegaFace Benchmark）之后，發(fā)現(xiàn)再也標(biāo)不動(dòng)了。標(biāo)注員能標(biāo)出來的數(shù)據(jù)永遠(yuǎn)是簡(jiǎn)單樣本，而人臉識(shí)別模型是個(gè)“深淵”，當(dāng)你凝視“深淵”的時(shí)候，“深淵”并不想看到你。

“深淵”想看到這樣的數(shù)據(jù)，并且明確被告知不是同一個(gè)人：

以及這樣的數(shù)據(jù)，并且明確被告知是同一個(gè)人：

在把標(biāo)注員弄瘋之前，不如先讓模型自己去猜一猜，說不定就猜對(duì)了呢？這其實(shí)就是半監(jiān)督學(xué)習(xí)的思路。利用已有的模型對(duì)無標(biāo)簽數(shù)據(jù)做某種預(yù)測(cè)，將預(yù)測(cè)結(jié)果用來幫助模型訓(xùn)練。這種自我增強(qiáng)（Self-Enhanced）的學(xué)習(xí)方式，雖然看起來有漂移（Drift）的風(fēng)險(xiǎn)，但實(shí)際用起來還挺好用 [5]。對(duì)于閉集（Close-Set）的問題，也就是所有數(shù)據(jù)都屬于一個(gè)已知的類別集合（例如ImageNet, CIFAR等），只需要模型能通過各種方法，例如標(biāo)簽傳播（labelPropagation）等，預(yù)測(cè)出無標(biāo)簽數(shù)據(jù)的標(biāo)簽，再把它們加入訓(xùn)練即可。

然而問題來了，人臉識(shí)別是一個(gè)開集（Open-Set）的問題。

例如，人臉比對(duì)（Verification）、人臉鑒定（Identification）等任務(wù)中，測(cè)試樣本的身份（Identity）通常沒有在訓(xùn)練樣本中出現(xiàn)過，測(cè)試過程通常是提取人臉特征進(jìn)行比對(duì)，而非直接通過網(wǎng)絡(luò)推理得到標(biāo)簽。同樣，對(duì)于無標(biāo)注數(shù)據(jù)，在采集的過程中，人臉的身份也是未知的。可能有標(biāo)注的數(shù)據(jù)的人臉屬于10萬個(gè)人，而新來的無標(biāo)注數(shù)據(jù)屬于另外10萬個(gè)人，這樣一來就無法通過預(yù)測(cè)標(biāo)簽的方式把這些數(shù)據(jù)利用起來。而聚類不同于半監(jiān)督學(xué)習(xí)，只需要知道樣本的特征描述（Feature）和樣本之間的相似度度量標(biāo)準(zhǔn)（Metric）就可以做聚類。聚完類之后再給每個(gè)類分配新的標(biāo)簽，同樣可以用來幫助提升人臉模型。

人臉聚類方法

傳統(tǒng)的人臉聚類一般采用LBP、HOG之類的手動(dòng)設(shè)計(jì)的特征，因?yàn)檫@類特征過于過時(shí)，不在我們討論的范疇。而深度學(xué)習(xí)時(shí)代的人臉聚類，一般采用卷積神經(jīng)網(wǎng)絡(luò)（CNN）中提取出來的特征 [4]。人臉識(shí)別的CNN通常把人臉圖片映射（Embedding）到一個(gè)高維的向量，然后使用一個(gè)線性分類器，加Softmax激活函數(shù)和交叉熵?fù)p失（Cross Entropy Loss）來訓(xùn)練。

紫色的向量即為人臉特征（圖片來自 [3]）

這種方式?jīng)Q定了這些經(jīng)過映射（Embedding）后的人臉在特征空間里分布在不同的錐形（Cone）中（下左圖），因而可以使用余弦相似度（Cosine Similarity）來度量相似度。或者如果對(duì)人臉特征做二范數(shù)（L2）歸一化，那么人臉特征則會(huì)分布在一個(gè)球面上（下右圖），這樣可以使用L2距離來度量。

圖示為2維，實(shí)際在高維空間（圖片來自 [6]）

有了特征和度量標(biāo)準(zhǔn)之后，就可以考慮如何選擇一個(gè)聚類算法了。現(xiàn)成的聚類算法包括K-Means,Spectral, DBSCAN, Hierarchical Agglomerative Clustering (HAC), Rank Order等以及它們的變種。利用這些方法聚類之后，將每一類中的樣本分配相同的標(biāo)簽，不同的類分配不同的標(biāo)簽，就可以用來充當(dāng)訓(xùn)練集了。

到此為止，似乎已經(jīng)可以順利地完成這個(gè)任務(wù)了。然而

使用20萬張圖提取特征之后來測(cè)試一下這些聚類算法，K-Means花了10分鐘，HAC花了5.7小時(shí)，DBSCAN花了6.9小時(shí), Spectral花了12小時(shí)。若使用60萬張圖片提取的特征來做聚類，K-Means超內(nèi)存了，HAC花了61小時(shí)，DBSCAN花了80小時(shí)，Spectral跑到天荒地老之后也甩了一句超內(nèi)存。當(dāng)圖片數(shù)量增加到140萬的時(shí)候，幾乎所有的聚類算法都掛了。

K-Means, Spectral, HAC等傳統(tǒng)聚類方法的問題主要在于以下方面：

(a) 聚類算法具有較高的時(shí)間復(fù)雜度。例如，K-Means是O(NKT)，Spectral是O(N^3)，HAC是O(N^2)。

(b) 通常認(rèn)為數(shù)據(jù)分布服從某些簡(jiǎn)單的假設(shè)。例如，K-Means假設(shè)數(shù)據(jù)類內(nèi)具有球狀的分布 [2]，并且每一類具有相同的方差（Ariance），以及不同的類具有相同的先驗(yàn)概率。然而對(duì)于大規(guī)模人臉聚類，無標(biāo)注數(shù)據(jù)通常來源于開放的場(chǎng)景（in-the-wild），數(shù)據(jù)內(nèi)部的結(jié)構(gòu)比較復(fù)雜，難以一致地服從這些假設(shè)。例如，我們期望數(shù)據(jù)長(zhǎng)這樣（如下左圖）：

(c) 通常使用某種特定的Metric。例如上述提及的Cosine Similarity和L2距離。同樣，對(duì)于復(fù)雜的數(shù)據(jù)結(jié)構(gòu)，衡量?jī)蓚€(gè)樣本是否屬于同一類，單純靠樣本之間的局部相似度是不夠的，這個(gè)metric需要融合更多信息。

(d) 缺乏較好的離群值（Outliers）控制機(jī)制。Outliers來源于人臉識(shí)別模型對(duì)難樣本的Embedding誤差，以及觀測(cè)到的數(shù)據(jù)不完整。盡管部分聚類算法例如DBSCAN理論上對(duì)Outliers魯棒，但從其實(shí)際表現(xiàn)來講這個(gè)問題遠(yuǎn)沒有得到解決。

有監(jiān)督的Metric

終于可以說說自己的工作了。我們被ECCV2018接收的一篇論文（Consensus-Driven Propagation in Massive Unlabeled Data for FaceRecognition），簡(jiǎn)稱CDP [1]，嘗試解決上述這些問題中的一部分。我們提出了一種有監(jiān)督的Metric用于人臉聚類，來部分解決無標(biāo)注數(shù)據(jù)內(nèi)部結(jié)構(gòu)復(fù)雜、依賴特定Metric、缺乏Outlier控制的問題，順便還解決了一下時(shí)間復(fù)雜度的問題（CDP做到了線性復(fù)雜度），當(dāng)然性能也提升了一大截。

介紹方法之前我們先來介紹一下Affinity Graph。Graph在半監(jiān)督學(xué)習(xí)和聚類上經(jīng)常出現(xiàn)。Affinity Graph的節(jié)點(diǎn)是數(shù)據(jù)樣本，邊代表數(shù)據(jù)之間的相似度。一種常見的Affinity Graph是KNN Graph，即對(duì)所有樣本搜索K近鄰之后將樣本與其近鄰連接起來得到。我們的方法CDP基于KNN Graph來構(gòu)建數(shù)據(jù)的結(jié)構(gòu)。

CDP本質(zhì)是學(xué)習(xí)一個(gè)Metric，也就是對(duì)樣本對(duì)（Pairs）進(jìn)行判斷。如下圖，CDP首先使用多個(gè)人臉識(shí)別模型構(gòu)建成一個(gè)委員會(huì)（Committee）， Committee中每個(gè)成員對(duì)基礎(chǔ)模型中相連的Pairs提供包括關(guān)系（是否是Neighbor）、相似度、局部結(jié)構(gòu)等信息，然后使用一個(gè)多層感知機(jī)（MLP）來整合這些信息并作出預(yù)測(cè)（即這個(gè)Pair是否是同一個(gè)人）。

這個(gè)過程可以類比成一個(gè)投票的過程，Committee負(fù)責(zé)考察一個(gè)候選人（Pair）的各方面信息，將信息匯總給MLP進(jìn)行決定。最后將所有的Positive Pairs組成一個(gè)新的Graph稱為Consensus-driven Graph。在此Graph上使用簡(jiǎn)單的連通域搜索并動(dòng)態(tài)剪枝即可快速得到聚類。由于MLP需要使用一部分有標(biāo)簽的數(shù)據(jù)來訓(xùn)練得到，所以CDP是一種基于有監(jiān)督的Metric的聚類方法。

CDP框架

接下來就是激fei動(dòng)chang人wu心liao的結(jié)果分析了。

在復(fù)雜度上，CDP由于只需要探索局部結(jié)構(gòu)，因此除了KNN搜索之外，聚類部分的復(fù)雜度是接近線性的。在20萬數(shù)據(jù)上，不計(jì)入KNN搜索（依賴別的庫(kù)）的時(shí)間的話，CDP單模型的耗時(shí)是7.7秒，多模型的耗時(shí)是100秒。在140萬數(shù)據(jù)上，CDP單模型的耗時(shí)是48秒，多模型的耗時(shí)是585秒。試驗(yàn)結(jié)果上看時(shí)間復(fù)雜度甚至低于線性（小于7倍）。

在聚類結(jié)果上，例如對(duì)20萬數(shù)據(jù)聚類，即使使用單模型也達(dá)到了89%的fsCore，多模型可以達(dá)到95.8%，強(qiáng)于大部分傳統(tǒng)聚類算法。各種聚類算法運(yùn)行時(shí)間和性能測(cè)試見GitHub。

我們的實(shí)驗(yàn)中使用CDP聚類后的數(shù)據(jù)加入人臉識(shí)別模型的訓(xùn)練之后，可以讓模型達(dá)到接近全監(jiān)督（使用Ground Truth標(biāo)簽）的結(jié)果。如下圖所示：

在兩個(gè)測(cè)試集（Benchmark）上，隨著數(shù)據(jù)的增多，用CDP聚類結(jié)果訓(xùn)練的人臉模型性能的增長(zhǎng)接近全監(jiān)督模型（所有數(shù)據(jù)都使用Groundtruth標(biāo)注）。有趣的是在IJB-A上我們的結(jié)果超過了全監(jiān)督模型，原因可能是訓(xùn)練集的Ground Truth標(biāo)簽會(huì)有一些噪聲（Noise），例如誤標(biāo)注，導(dǎo)致全監(jiān)督模型在IJB-A的某些測(cè)試樣例上表現(xiàn)不佳。

下圖是切換不同的CNN模型結(jié)構(gòu)后的結(jié)果：

聚類后的部分結(jié)果如下圖所示：

每一組代表聚完類后屬于同一類

我們發(fā)現(xiàn)CDP還可以用來做數(shù)據(jù)和標(biāo)簽清理（Denoise）。例如一個(gè)標(biāo)注好的數(shù)據(jù)集可能有一些標(biāo)錯(cuò)的樣本，或者非常低質(zhì)量的圖片，可以使用CDP來找到這些圖并舍棄。如下圖：

每一組人臉在原始標(biāo)注中屬于同一個(gè)人，左上角數(shù)字是CDP分配的標(biāo)簽，紅框中的樣本為CDP丟棄的樣本，包括：1. 被錯(cuò)誤標(biāo)注進(jìn)該類，實(shí)際是一個(gè)孤立點(diǎn)的樣本。2. 低質(zhì)量圖片，包括過度模糊、卡通等。

在這篇工作中我們發(fā)現(xiàn)，基于學(xué)習(xí)的Metric能基于更多的有效信息進(jìn)行判斷，會(huì)比手動(dòng)設(shè)計(jì)的Metric更擅長(zhǎng)解決比較復(fù)雜的數(shù)據(jù)分布。另外，這種類似多模型的投票的方式在魯棒性上帶來了很大提升，這樣可以從無標(biāo)簽數(shù)據(jù)中發(fā)掘出更多的難樣本。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

人臉識(shí)別

人臉識(shí)別

+關(guān)注

關(guān)注
76

文章
4015

瀏覽量
82120
cnn

cnn

+關(guān)注

關(guān)注
3

文章
353

瀏覽量
22277

原文標(biāo)題：人臉聚類那些事兒：利用無標(biāo)簽數(shù)據(jù)提升人臉識(shí)別性能

文章出處：【微信號(hào)：SenseTime2017，微信公眾號(hào)：商湯科技SenseTime】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

無感人臉識(shí)別考勤解決方案：如何用科技實(shí)現(xiàn)考勤的無感化、智能化

帶來了革命性的變革，實(shí)現(xiàn)了考勤的無感化、智能化。無感人臉識(shí)別考勤系統(tǒng)依托于先進(jìn)的人工智能技術(shù)和人臉識(shí)別

發(fā)表于 01-15 15:24 ?67次閱讀

校園人臉識(shí)別閘機(jī)通道的應(yīng)用

隨著科技的飛速發(fā)展，人臉識(shí)別技術(shù)正逐步滲透到我們生活的各個(gè)領(lǐng)域，其中，教育領(lǐng)域的應(yīng)用尤為引人注目。在校園內(nèi)，人臉識(shí)別閘機(jī)通道的安裝與啟用，不僅極大地

發(fā)表于 01-15 15:02 ?67次閱讀

人臉識(shí)別技術(shù)的原理介紹

人臉識(shí)別技術(shù)是一種基于人臉特征信息進(jìn)行身份識(shí)別的生物識(shí)別技術(shù)。它通過分析人臉圖像，提取

發(fā)表于 07-04 09:22 ?1464次閱讀

如何設(shè)計(jì)人臉識(shí)別的神經(jīng)網(wǎng)絡(luò)

人臉識(shí)別技術(shù)是一種基于人臉特征信息進(jìn)行身份識(shí)別的技術(shù)，廣泛應(yīng)用于安全監(jiān)控、身份認(rèn)證、智能門禁等領(lǐng)域。神經(jīng)網(wǎng)絡(luò)是實(shí)現(xiàn)人臉

發(fā)表于 07-04 09:20 ?707次閱讀

人臉識(shí)別模型訓(xùn)練流程

人臉識(shí)別模型訓(xùn)練流程是計(jì)算機(jī)視覺領(lǐng)域中的一項(xiàng)重要技術(shù)。本文將詳細(xì)介紹人臉識(shí)別模型的訓(xùn)練流程，包括數(shù)據(jù)準(zhǔn)備、模型選擇、模型訓(xùn)練、模型評(píng)估和應(yīng)用

發(fā)表于 07-04 09:19 ?1054次閱讀

人臉識(shí)別模型訓(xùn)練失敗原因有哪些

人臉識(shí)別模型訓(xùn)練失敗的原因有很多，以下是一些常見的原因及其解決方案： 數(shù)據(jù)集質(zhì)量問題 數(shù)據(jù)集是訓(xùn)練人臉識(shí)

發(fā)表于 07-04 09:17 ?695次閱讀

人臉識(shí)別模型訓(xùn)練是什么意思

人臉識(shí)別模型訓(xùn)練是指通過大量的人臉數(shù)據(jù)，使用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)算法，訓(xùn)練出一個(gè)能夠識(shí)別和分類人臉

發(fā)表于 07-04 09:16 ?690次閱讀

人臉檢測(cè)和人臉識(shí)別的區(qū)別是什么

人臉檢測(cè)和人臉識(shí)別是計(jì)算機(jī)視覺領(lǐng)域的兩個(gè)重要技術(shù)，它們?cè)谠S多應(yīng)用場(chǎng)景中都有廣泛的應(yīng)用，如安全監(jiān)控、身份驗(yàn)證、社交媒體等。盡管它們?cè)谀承┓矫嬗邢嗨浦帲鼈冎g存在一些關(guān)鍵的區(qū)別。本文將詳細(xì)介紹

發(fā)表于 07-03 14:49 ?1346次閱讀

人臉檢測(cè)與識(shí)別的方法有哪些

人臉檢測(cè)與識(shí)別是計(jì)算機(jī)視覺領(lǐng)域中的一個(gè)重要研究方向，具有廣泛的應(yīng)用前景，如安全監(jiān)控、身份認(rèn)證、智能視頻分析等。本文將詳細(xì)介紹人臉檢測(cè)與識(shí)別的方法。引言

發(fā)表于 07-03 14:45 ?785次閱讀

人臉識(shí)別門禁系統(tǒng)賦能社區(qū)安防

一、提升安全性人臉識(shí)別門禁系統(tǒng)通過使用生物識(shí)別技術(shù)，即基于人臉特征的身份識(shí)別系統(tǒng)，能夠顯著

發(fā)表于 07-02 11:09 ?527次閱讀

如何挑選理想的人臉識(shí)別考勤系統(tǒng)產(chǎn)品？人臉識(shí)別設(shè)備的選型

如何挑選理想的人臉識(shí)別考勤系統(tǒng)產(chǎn)品？在挑選理想的人臉識(shí)別考勤系統(tǒng)產(chǎn)品時(shí)，需要綜合考慮多個(gè)方面，包括但不限于設(shè)備的性能、兼容性、

發(fā)表于 06-05 14:59 ?523次閱讀

人臉識(shí)別終端 10寸人臉機(jī)

終端人臉識(shí)別

深圳市遠(yuǎn)景達(dá)物聯(lián)網(wǎng)技術(shù)有限公司
發(fā)布于 :2024年04月22日 16:01:46

小區(qū)無感人臉識(shí)別門禁攝像機(jī)，多人同時(shí)識(shí)別通過 #人臉識(shí)別 #智能攝像機(jī)

AI人臉識(shí)別

jf_07511428
發(fā)布于 :2024年03月06日 22:53:18

公司人臉識(shí)別考勤門禁攝像機(jī)#人臉識(shí)別#智能攝像機(jī)

AI人臉識(shí)別

jf_07511428
發(fā)布于 :2024年03月06日 22:52:08

人臉識(shí)別技術(shù)的原理是什么人臉識(shí)別技術(shù)的特點(diǎn)有哪些

人臉識(shí)別技術(shù)的原理人臉識(shí)別技術(shù)是一種通過計(jì)算機(jī)以圖像或視頻為輸入，識(shí)別、檢測(cè)、跟蹤和分析人臉的

發(fā)表于 02-18 13:52 ?2157次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

無標(biāo)簽數(shù)據(jù)如何提升人臉識(shí)別性能

評(píng)論

無感人臉識(shí)別考勤解決方案：如何用科技實(shí)現(xiàn)考勤的無感化、智能化

校園人臉識(shí)別閘機(jī)通道的應(yīng)用

人臉識(shí)別技術(shù)的原理介紹

如何設(shè)計(jì)人臉識(shí)別的神經(jīng)網(wǎng)絡(luò)

人臉識(shí)別模型訓(xùn)練流程

人臉識(shí)別模型訓(xùn)練失敗原因有哪些

人臉識(shí)別模型訓(xùn)練是什么意思

人臉檢測(cè)和人臉識(shí)別的區(qū)別是什么

人臉檢測(cè)與識(shí)別的方法有哪些

人臉識(shí)別門禁系統(tǒng)賦能社區(qū)安防

如何挑選理想的人臉識(shí)別考勤系統(tǒng)產(chǎn)品？人臉識(shí)別設(shè)備的選型

人臉識(shí)別終端 10寸人臉機(jī)

小區(qū)無感人臉識(shí)別門禁攝像機(jī)，多人同時(shí)識(shí)別通過 #人臉識(shí)別 #智能攝像機(jī)

公司人臉識(shí)別考勤門禁攝像機(jī)#人臉識(shí)別#智能攝像機(jī)

人臉識(shí)別技術(shù)的原理是什么人臉識(shí)別技術(shù)的特點(diǎn)有哪些