視頻人臉識別是計算機視覺、模式識別、視頻分析與理解等領域的重要研究課題。視頻人臉識別的研究不僅在理論上具有重大意義,同時在生物特征鑒別、視頻監控、信息安全等領域具有廣泛的應用前景,已經成為人臉識別領域的研究熱點和難點問題。
目前,絕大多數的視頻人臉識別都是通過提取視頻序列中包含人臉的關鍵幀,采用基于靜態圖像的人臉識別算法達到視頻分類的目的,這其中就包括多視角融合、子空間或流形分析等。該類方法中關鍵幀的選擇歧義性較大,需要對整個視頻進行分析才能實現關鍵幀的準確定位,降低了視頻人臉識別系統的效率和實時性要求,適合于人物目標配合、光照及視角良好并且視頻質量較高的環境下的應用。
近年來,基于圖像集合和基于視頻序列的視頻人臉識別方法得到了廣泛關注。其中,基于圖像集合的視頻人臉識別方法是將視頻作為一個無序的幀圖像集合,通過流形、子空間、Affine Hull、協方差矩陣等對圖像集合進行建模以實現視頻人臉的識別。基于視頻序列的視頻人臉識別算法是通過設計視頻紋理描述算子、引入視頻上下文信息等方式提高識別精度和效率。但是,視頻紋理算子及視頻上下文信息的獲取十分困難,計算復雜度較高,同時,這類算法對人臉表情變化、目標姿態變化等影響識別性能的因素不夠魯棒。
自然視頻大多數是非專業人員采集的,視頻采集設備有限,視頻環境光照條件較差,目標姿態多變并且伴隨運動模糊,同時,為了便于存儲及傳輸,通常還以壓縮格式存儲,這些噪音因素的存在都使得解決視頻人臉識別問題具有極大的挑戰性。為實現這種低分辨率、目標姿態多變條件下的視頻人臉的魯棒識別,設計能夠適應這種復雜環境下的視頻人臉識別學習算法就變得尤為重要。
為解決視頻環境下人臉識別問題中關鍵幀難以準確定位導致的識別率偏低等問題,我們提出了一種基于多示例學習的視頻人臉識別算法。該算法將復雜環境下的視頻人臉識別問題視為一個多示例問題,將訓練集合中的每個視頻視為一個包,將視頻包中歸一化處理后的視頻幀圖像視為包中的示例。視頻包帶有標記而視頻包中的示例是沒有標記的,利用有效的多示例學習算法在訓練集合樣本空間中學習并生成分類器,以實現對測試包的預測及分類。
另外,視頻采集環境的光照變化、目標的姿態變化等,都在一定程度上造成了視頻人臉識別上的困難,為此,我們在算法實現過程中還采用了基于改進的Fisher加權準則的TPLBP進行示例的紋理特征表示,該算子具有較強的可辨別能力,并且對均勻光照變化是魯棒的。
目前,關于視頻人臉識別問題主要結合實際應用場景進行分析,鑒于此,我們提出了一種適用于低信噪比環境下的基于加權Fisher準則的多示例學習視頻人臉識別算法,算法在得到較高的識別精度的同時,有效解決了目標姿態多變視頻環境中的人臉視頻關鍵幀難以定位的問題,并且具有較強的抗干擾能力,對均勻光照變化、姿態變化等也具有較好的魯棒性。如何解決算法時間復雜度較高,學習算法的泛化能力等問題成為我們今后研究工作的重點。
-
人臉識別
+關注
關注
76文章
4011瀏覽量
81860 -
計算機視覺
+關注
關注
8文章
1698瀏覽量
45980
發布評論請先 登錄
相關推薦
評論