峰會以「洗牌結束,格局重構」為主題,會上代表未來新十年的15家企業,為現場1000余位聽眾和線上幾十萬觀眾,分享迎接安防新十年的經營理念與技術應用方法論。
在下午場的演講環節上,的盧深視CEO戶磊為峰會帶來了精彩的演講。
戶磊提到,大庫時代,金融、交通、應急管理等眾多場景亟需千萬級精準人臉識別技術方案。目前行業內現有方案為多引擎,多層級,分庫管理模式,具有系統復雜、軟硬件開銷大、成本高、效率低等諸多不足。
理想的大庫識別方案應該具備以下幾點:千萬級別底庫,萬億分之一誤識別率,魯棒性好,高度兼容性,以及價格適宜。的盧深視是全國首個實現省級規模三維人像應用的AI公司。
在系統架構方面,分為三個層次,由前端多維智能感知系統、千萬大庫云端中臺和基于大數據的多模態關聯分析與預測后臺組成。
在技術架構方面,自下而上分為核心算法層、平臺技術層、業務中臺層和應用層。在算法層,圍繞3D視覺技術的深度感知算法族、三維重建算法族和人臉識別算法族至關重要。在業務中臺層,如何通過數據接入、數據管理、大庫管理和人臉比對算法等各技術模塊的不斷優化,從而提升應用效率至關重要。
再者,的盧深視建立三維數據標準及評價打分體系,這是后續確保三維應用效果的基礎,的盧深視結合實際工程應用經驗,提出了數據質量要求及評價標準。
戶磊還總結了的盧深視3D識別的優勢:
準確率高,錯誤率低于萬億分之一,滿足金融支付標準。
魯棒性好,基于深度信息能夠做到不受光線影響,針對大角度、濃妝、多膚色多人種等識別場景,也能夠準確識別。
安全性高,在活體檢測方面,能夠實現2D平面偽裝攻擊方式100%防御。
以下是戶磊演講全文:
的盧深視CEO戶磊
大家好!我是的盧深視的創始人兼CEO戶磊,今天非常感謝各位行業的專家和嘉賓老師們來聽我分享,今年在疫情背景下,AI安防特別需要一個這樣的行業交流機會。
一、大庫時代,千萬級刷臉系統落地面臨的挑戰
任何場景的AI落地都需要有需求,千萬級精準人臉識別是有其需求的,尤其是今年新冠疫情,給我們國家和城市包括應急管理體系、常住人口信息化管理、大交通等在內的領域都帶來了全面的考驗。
其實在這之前已經有相應的趨勢。自改革開放以來,中國從原來的城鄉二元化結構逐步走向全面的城市化,特別是近10年到15年,超級城市不斷涌現。
大家應該能感受到,除了北上廣深以外,原來所謂的二線城市、準二線城市規模逐步增長,千萬級人口的城市不斷出現。
千萬級人口聚集在一個城市,如何管理?如何服務?這是千萬級庫才能解決的問題。
同時,疫情也帶來一個非常重要的課題,之前的城市管理和城市服務更多地是考慮一些特殊人群,比如公安領域,考慮的是刑偵追逃,刑偵追逃可能是一個幾萬到幾十萬的小庫。
疫情之后,每個人都可能是病毒的攜帶者或者潛在傳播者,這時,不止特殊人群,我們需要對所有的人進行疫情管控,服務人口的體量一下變成千萬級甚至億級規模。
同時,隨著生活基礎設施越來越便利,在大交通和大出行體系中,出現了城市千萬級人流量在封閉場景中流動的應用。比如地鐵是一個封閉系統,一個城市每天載客客流量在1200萬到1500萬規模,這也屬于大庫管理體系。
再比如金融支付,對安全性要求很高,同時它的庫也很大,支付寶和微信的刷臉金融支付,后臺用戶數目都是億級規模。
行業會員領域,尤其是一些連鎖店,可能有幾十萬、百萬甚至千萬的會員體系,他們也需要對會員進行精準的身份識別和個性化服務。
這些都是千萬級甚至億級大庫的場景,且都有急切的需求,但是現有方案無法充分滿足需求,主要存在以下幾個問題。
多引擎
公安和安防領域一般采用多引擎的方式,比如一家廠商算法不夠準,就采用多廠商、多算法同時進行,通過多重比對提高識別準確率。
這樣帶來一些問題,一是系統重復建設,資源損耗比較大,整體系統造價很高;二是不同廠商之間系統缺乏統一標準,兼容性也比較差,整個系統很復雜,維護很困難;三是可能這種方式還不能完全滿足需求,還是要通過人工逐級排查實現進一步的精準識別,推動身份的確認。
多層級
很多地方會采用區級、市級、省級逐級排查的方式,這樣會讓不同層級信息無法打通,存在信息孤島,也使得查詢效率低,不具備易用性。
分庫管理
通過特定標準或標簽對庫進行拆分,把大庫變成小庫,然后進行分庫管理和識別,從而提高識別準確率。這也會帶來一些問題,比如統籌管理難度大,而且對于具備多重身份的人,數據會變得冗余,嚴重影響用戶體驗。
總的來說,現有方案會導致系統復雜、軟硬件開銷大、成本高、效率低。
我們回歸到問題本身,理想的大庫識別方案應該具備哪些特點?
首先,需要是千萬級別底庫;準確率要達到千萬、萬億分之一的誤識別率;魯棒性要好,快速且安全,有足夠的反攻擊能力;性能要開放,能夠支持多模態數據接入,兼容性要好;要經濟實用,方案切實可行且能利舊。
二、標桿案例研讀與標準建庫方案
的盧深視成立于2015年,是最早一批做三維視覺的AI企業,專注三維視覺智能感知技術,在高精度深度感知成像、三維實時高精度重建、三維跟蹤識別及感知等技術方向上,處于國際領先水平。
當時我們就在想,人臉的三維信息經過了精準重建之后能用來干什么?這些圖像信息里有豐富的人臉特征,加上形狀信息之后,特征會更豐富,也能支撐更大庫的識別。
所以我們當時就聚焦3D人臉識別這個方向,也非常榮幸,我們承接了一些國家級項目,在某個標桿省份實現了一個省級3D人臉應用,并且在這個基礎之上真正實現了千萬級大庫的精準識別。
這里介紹的是我們在2015到2016年的一個案例。這是基于的盧深視“哨兵”三維人像多維數據管控通道實現的,通過設備的部署,協助用戶實現了全國首個省級規模三維人像應用,后期,我們把它切換成不需要帶證件識別的直接刷臉識別安檢方式。
這個設備本身具備“一次通行、多維采集、關聯碰撞、全面預警”的特性,在實現二維、三維人臉識別的同時還能提供四軌合一的分析,通過集中式管理平臺,還可以實現行動軌跡與綜合研判分析。
這個案例當時為什么能夠做成?大家一般會想,做3D人臉識別首先要建庫,但是用戶會覺得麻煩,成本就會特別高。如何在用戶能接受情況下幫助用戶把庫建設起來,并且實施好整個系統?
上圖是我們當時的一個建設思路,的盧當時采用了“邊建邊用、邊用邊建”的創新模式。
從2D人臉到3D人臉都是在拍人臉,只不過前端的傳感器不同,相機從2D相機換成了3D相機,其實3D相機本身包含2D信息,這在2015年、2016年是比較前瞻性的應用,現在隨處可見,高鐵站的人臉識別設備、酒店前臺的人臉識別終端都在應用。
我們當時主要通過四個步驟:
1. 通行人員通過三維終端如配合式設備、通道式設備、抓拍式設備或原有二維終端設備時,終端設備采集通行人員的人臉信息后實時向三維人像庫查詢。
2. 三維人像庫返回比中的人員身份信息。
3. 三維人像庫中暫未錄入通行人員的數據,終端設備向客戶已有的二維人像庫查詢,比對通行。
4. 未在庫人員數據自動錄入到三維人像庫中,通行人員下次通行時即可完成三維比對通行。
它主要是通過對身份證信息中的照片和現場拍的圖像做人臉識別比對,準確率可以保證,在這樣的前提下,我們把2D攝像頭換成3D攝像頭,就可以同時采集到3D信息。雖然采集的3D信息質量不一定很高,但是只要有足夠的應用頻次,就可以幫助用戶實現一個高質量的3D數據庫建設,而不需要特地去建一個3D人臉數據庫。這是我們的建設流程。
只要思路轉換后,就會發現幫助用戶建庫的方式非常多元,可以有很多入口。人臉取號機、人證核驗設備、手持式的移動終端等,所有需要做認證核驗的終端都可以變成入庫設備,當這些終端應用到生活的方方面面時,采集的效率和頻次就會足夠高,建設速度就將加快且成本低。
這是支撐的盧這一套系統的產品矩陣體系。
三、千萬級刷臉系統關鍵技術點剖析
首先從系統架構來講,我們把千萬級大庫的建庫以及比對系統分成三個層次:
前端多維智能感知系統
核心是的盧深視高性價比3D結構光相機,它深度集成了高性能三維人臉識別算法,降低了后端的計算開銷,保證算法準確率的同時大大降低客戶集成成本,形成前端多維智能感知系統。
千萬大庫云端中臺
支持千萬三維大庫人臉建庫、清洗和檢索,精度遠超二維的解決方案,同時,的盧與國產芯片做了深度集成,性能超過同等級國外方案,并且可以與智能前端及邊緣節點協同處理,最優化調度系統內計算資源,提高計算資源利用率,降低系統成本。
多模態關聯分析與預測
在前端感知系統和中臺的基礎之上,基于大數據的邏輯推理、時空軌跡關聯分析,將2D/3D人臉、人體、物品、時間、地點以及人體的體貌特征和形態動作特征等多維大數據融合,深度挖掘數據之間的關聯性,實現預測預警。
技術架構分為四個層次,分別是核心算法層、平臺技術層、業務中臺和應用層。
最底層是核心算法層,其中最重要的是3D算法層,基于RGBD全信息處理,在恢復深度信息上我們有一整套深度感知的算法,包括深度對齊、后處理、人臉檢測與跟蹤等等。同時,三維重建算法族也是一個核心層次,它可以真正把一個三維物體的形狀信息進行完整恢復,這是一個非常重要的支撐層次。
在這個核心算法之上,我們有平臺技術層,后端的技術包括通信計算、協同優化等技術。
再往上是業務中臺,進行數據接入、數據管理、數據清洗、數據優選。因為前面建庫過程中,設備來源非常多元,通過業務中臺的一系列數據處理過程后,才能得到優質的數據,然后融到數據庫中進行數據同步,最終支撐各種各樣的應用。
這是整個技術架構。
經過大家多年的摸索,2D人臉庫逐漸形成一套標準,但是3D有深度信息的數據,這些數據如何存儲、有什么特點、有何技術要求等方面,行業還沒有形成規范。
的盧這些年在這方面不斷探索,建立起一整套數據標準和評價體系。我們希望和行業協同,將它變成一個行業標準。
另外,對于深度識別的設備,即傳感器本身,需要具備怎樣的深度采集能力和精準感知能力?
我們對大庫情形下的識別精度也有一整套測試的方法和標準。市面上通行的相機比較強調絕對精度,但絕對精度對于人臉和人體物體的精細特征來講,并不是一個非常重要的指標。事實上,相對形狀的相對精度和對于形狀的擬合度是一個比較重要的指標,恢復人臉肌理的特征也是比較重要的部分。我們有一套深度質量的評價體系,對這些要素進行綜合性的打分,從而形成對前端相機的整體評價。
3D人臉識別技術算法與2D人臉識別有所不同,通常來講,2D人臉識別通過攝像頭獲取圖像數據信息后進行人臉檢測,然后進行特征提取和信息比對。
而3D的流程比較復雜,前端是符合標準的3D攝像頭,在獲取了圖像數據并進行了人臉檢測之后,還需要進行RGBD數據配準與3D信息重建,把人臉信息進行完整的三維恢復。同時,在恢復的三維人臉模型上提取三維人臉特征,最后進行比對。
在后臺應用上,我們一整套后臺應用服務器,能夠單獨部署,也可以集成部署,并且支撐高并發請求的快速處理和及時響應。
同時,我們針對寒武紀MLU270的體系結構特點改進了深度學習網絡結構,設計最佳并發處理模式,提高吞吐率,充分利用硬件平臺算力。在保證精度基本不損失的情況下,突破了三維人臉識別算法的INT8量化技術。
另外強調一下多模態架構的理念。物理世界中的物體都是3D的,獲取到完整的3D信息對于系統精準感知和識別的進一步提升非常重要,換句話說,增加數據維度是最有效提升系統感知能力的方式,可以以此突破深度學習發展的瓶頸。
我們認為,多模態的架構是未來的趨勢,3D也只是這個多模態架構中的一個方向,但它是一個比較易得的方向,因為它不會改變原來2D人臉識別中各種各樣的交互和體驗,同時還能提升整個系統的準確性和完全性。當然,以后我們還會融合更多技術,把這個系統做的更好、更安全、更可靠。
總結一下3D識別的優勢:
準確性高。千萬大庫下錯誤率低于萬億分之一,具有極高的安全性。
魯棒性好。不受光線影響,可以實現7X24無間斷地安全保障,對于大角度、濃妝識別的準確率更高,體驗感也更好,大角度可識別;對不同膚色人種識別率幾乎不受影響。
安全性高。對于活體檢測,可以做到2D平面偽裝攻擊方式100%防御。
總結一下的盧深視大庫識別方案。精準,可以做到萬億分之一誤識別率;具備千萬級別底庫前提下精準識別的能力;高效,魯棒性好,快速且安全;支持多模態,兼容性好;具有切實可行的建設方案,可利舊,性價比高。
四、的盧深視提供“三維全?!奔夹g支撐
最后對的盧深視做一個簡單介紹。
的盧深視公司基于三維機器視覺和人工智能技術,提供實體空間人像身份、行為、軌跡的精準感知和整體解決方案。公司團隊是國內極少在深度感知成像、三維重建、三維識別測量定位等全棧式三維技術領域具備國際領先能力的原創團隊。
我們認為3D是一個很大的賽道,這個賽道中的關鍵點不僅在于算法,還在于硬件傳感器,它要面對不同的應用場景。我們常提到的開放場景的空間傳感和識別,物體的傳感和識別,都是我們的研究方向。
我們總部在北京,在合肥、杭州都有研發中心,深圳是我們的營銷中心,同時我們在很多地方建設了本地化的服務網絡,跟很多高校也有深度合作。
我們的技術定位,是以“人”為標的物,構建“光電+算法”全棧3D機器視覺及其智能架構。
我用“機器視覺”這個詞呼應一下前面華為機器視覺總裁段愛國講的,我們也認為,以后視覺的發展核心不再是給人看,而是給機器看。3D在這個環節中是非常重要的一個元素。
因為圖像視覺發展多年,都是圍繞讓人眼看著更好去不斷演進的,3D的數據,特別是深度數據,是人眼不太能感知到的數據,或者說人眼對這個數據不太敏感,但是對機器很重要,機器需要這些更豐富、更準確、更相關的數據來更好的完成它的任務。
其實光本身的信息中還有很多諸如相位、偏振態的信息,這些都可以進一步提升機器視覺應用的準確性和安全性,從而擴展它應用的范圍。
在這個維度中,我們主要是聚焦于人全息特征的精準識別和分析,在3D人臉方向,我們經驗比較豐富,另外,我們也在研究人的體貌特征分析技術,以及結合各種各樣的數據實現精準的識別的應用。
從基礎研究路徑看,3D與2D不同,3D傳感器非常重要,但目前還處于產業初級階段。算法、數據、傳感和應用,這四個維度交織演進,是我們終極的技術演進路徑。
最后回到今天的主題,隨著人臉識別在各行各業得到更多用戶的認可,千萬級大庫應用的進一步升級也會成為重要課題。任何一個系統隨著廣泛的應用都受到更多的關注,也會催生更多新的需求,我們堅持回到技術本身,從技術上提升應用能力。
責任編輯:pj
-
傳感器
+關注
關注
2550文章
51039瀏覽量
753087 -
3D
+關注
關注
9文章
2875瀏覽量
107486 -
機器視覺
+關注
關注
161文章
4369瀏覽量
120284
發布評論請先 登錄
相關推薦
評論