“目前這個領域的投資熱度不減,但還是趨于冷靜的。”市場研究機構IDC人工智能領域分析師劉艷霞這樣對本刊評價人臉識別領域目前的市場投資情況,在他們看來,“熱度不減”是因為在目前市場應用還不是很多的情況下,這個領域還有很多新的應用場景亟待開發,里面有大量的機會存在。“趨于冷靜”則是因為在已有的賽道內已經聚集了不少實力雄厚的競爭者。“在這個時間點,后面加入的一些公司相對來講就處于一個比較劣勢的地位,可能你很難再有機會能夠追趕上來。”鄧亞峰對本刊如此說道,他來自國內另一家計算機視覺領域創業公司格靈深瞳。
根據國海證券研究所行業報告研究院的研究顯示,人臉識別主要應用領域市場規模,公安領域16億以上、交通領域50億以上,金融領域百億級別、教育領域百億級別,在不考慮大安防硬件存量市場的前提下,整體市場規模就達到數百億。
而安防市場的廣闊前景則是人臉識別技術目前的最大戰場。根據中安網數據,中國安防行業市場規模從2012年的3240億元增長到了2016年的5400億元,年復合增長率達到驚人的15%,而其中2016年視頻監控產品的產值就達到了962億元。而這也是云從科技創始人周曦的信心來源,去年他就曾經公開預測“未來5年之內,國內人臉識別的市場規模要達到1000億元”。
來自第三方研究機構的劉艷霞沒有周曦那么充足的自信,她認為單純的“人臉識別”可能達不到1000億的規模,但如果把所有上下游的硬件攝像頭與軟件服務都算上,那就沒問題。“在安防領域,如果算上軟件及人工服務,一個攝像頭的投入可能會達到10萬元,那100萬個攝像頭就有1000億元了,而100萬個攝像頭也就是一、二線城市普通攝像頭投入的規模,所以這樣算的話,一個城市可能就有1000億了。”而如果單純從技術層面來看,“1000億”顯然是一個有些夸大的數字。
格靈深瞳CTO鄧亞峰也對本刊表示:“如果提供的只是核心算法或者提供一些核心的人臉識別設備的話,我覺得這個市場可能沒有到千億這個規模,但它可能帶動的市場也許真的能有這么大。”
政府的支持則是另一股助推劑。2015年以來,政府出臺了多項政策法規,為人臉識別在安防、金融等領域的普及打下了堅實的基礎,掃清了政策障礙。比如2015年4月,中央辦公廳就印發了《關于加強社會治安防控體系建設的意見》,其中提到“未來網絡化精細管理是平安城市和智能交通管理的發展方向”,而人臉識別技術則是這一切實施的重要技術基礎。
同時,政府采買本身也是這個領域目前最重要的收入來源,其中公安系統理所當然地成為大頭,你幾乎可以從每一家相關創業公司的官網上看到他們和不同地區公安部門的合作協議。IDC中國人工智能研究總監張卓此前在接受媒體采訪時曾經表示,為國家安全提供智能監控系統給了這些人臉識別領域的初創企業在起步時的巨大助力。他同時表示,中國每年公共安全預算充裕,這使得這一領域的公司創收也較為容易。
“3·15”的打擊證明它還沒有完全成熟
事實上,作為計算機視覺領域的一個分支,對于人臉識別技術的研究可能至少有50年的歷史,目前可以查閱到的最早一篇論文發表于1967年。但在隨后的二三十年間,相關的研究因為各種條件的限制并沒有太大的進展。“1998年微軟亞洲研究院建院的時候我們第一個成立的組就是視覺計算組,那時候計算機視覺應用非常少,很冷門。”微軟亞洲研究院常務副院長郭百寧博士此前就對本刊記者這樣說道。但到了2012年,深度學習技術的出現才真正讓整個人工智能領域看見了可用的曙光,識別率逐年上升。目前,頂尖的人臉識別算法在“一對一”人臉驗證的場景下準確率已經超過了人類的平均水平。
LFW(Labeled Faces in theWild Home)是國際權威的人臉識別數據庫,它是為了研究非限制環境下的人臉識別問題而建立,里面包含超過1.3萬張人臉圖像。目前,在這個數據庫的測試結果中,幾乎全球頂尖團隊的準確率都超過了99%。“我們在這個數據庫上的識別準確率已經達到了99.7%以上,這個準確率已經比絕大多數人類的識別率要高了。”陳剛對本刊說道,他是微軟亞洲研究院創新工程組首席項目開發經理,目前主要負責人臉識別技術的工程開發工作。
微軟亞洲研究院創新工程組首席項目開發經理陳剛
當然,在測試環境下得到的數據并不意味著人臉識別在技術上已經完全成熟。“要看測試數據集的表達能力是否與目標場景的數據情況和使用要求相匹配”,陳剛解釋道,由于LFW這樣的數據庫中的測試內容是固定的,所以很容易進行有針對性的訓練,“如果現在去做視頻安防類的測試,它的那個數據集就和這個數據是不一樣”。而根據鄧亞峰提供的數據,在更加靠近現實的視頻動態人臉識別場景中,現有的人臉識別也只能在理想場景中達到60%~70%的水平。
作為應用在登錄、安防等領域的技術,是否可靠其實是普通用戶最關心的事,但在年初的央視“3·15”晚會上,人臉識別的相關技術漏洞卻被當眾曝光。在演示過程中,一張他人的靜態自拍照,通過技術處理,可以變成能眨眼睛、能微笑的“偽活人”;而借助3D建模技術,這張自拍照還能讓自己“變臉”成另一個人,輕易騙過登錄系統。一時間,關于人臉識別是否足夠安全的話題也讓很多用戶擔心。
但在這個行業內的專業人士看來,“3·15”晚會所曝光的問題既反映了人臉識別技術上的不夠成熟,也反映了很多應用廠商在技術使用上的不負責任。
從技術上看,目前人臉識別技術主要分為2D人臉識別(包括彩色圖像,紅外圖像)和3D人臉識別。2D人臉識別是在彩色圖像上的識別方法,主要優勢在于檢測數據獲取方式便捷,同時目前算法相對成熟,是目前主流的技術應用方向。但“3·15”晚會上的案例已經暴露了在安全性要求高的場景下,靠單一人臉識別算法來身份驗證的使用方式是不夠安全的。由于人臉在2D維度的投影會使得部分有效信息缺失,所以容易被犯罪分子攻擊。
而3D人臉識別方法是基于人臉3D立體模型進行識別,充分利用立體空間信息,能有效解決2D識別的遮擋以及角度旋轉等識別難點,識別精度較高。傳言iPhone 8將使用的“3D結構光”技術就屬于這一類別。曠視科技工作人員對我們說道:“如果結構光屬實,那這項技術將可以抵御所有的翻拍攻擊手段(例如屏幕翻拍照片、翻拍視頻、紙張打印、相片打印等),因為翻拍攻擊的都是2D人臉畫面,而結構光能有效分辨出2D人臉和3D人臉。”目前3D人臉識別的問題主要在于數據采集相對困難,采集數據量十分巨大,對計算機的計算存儲能力要求較高,在商業化上仍然不夠成熟,但也許會是未來的主要方向。
但更嚴重的問題不在技術本身,而在于如何使用技術。“在有些情況下我們沒有解決好某一些相關的技術,比如活體檢測的相關技術,那可能它就不適合在這樣的場景下去應用,但是有些人可能就要這樣用它,這就會造成一些潛在的風險。”鄧亞峰說道。同時,他也強調人臉識別還不是一項完全成熟的技術,不應該被使用在任何場景下。
而陳剛則認為,從長遠的角度來看,不同的安防場景其實有不同的要求,就需要不同的技術解決方案,所有安防環節都要依賴于場景的要求,有針對性地設計選擇合適的解決方案是一個思路。“我們人臉這個圈子基本有一個共識,就是作為‘人臉’這種生物識別的話,作為單一技術去做高層級安全水平的安防,其實是有挑戰的,提高安全等級的通常做法是結合其他驗證手段、信息一起驗證。”
為支付寶等金融產品提供身份認證服務的曠視科技也持相似的看法,他們認為在單攝解鎖的場景下,他們的技術“已經可以應對大部分的攻擊場景”了,因此用于解鎖是夠用的。然而,“到了支付級的安全程度,則需要依賴硬件(攝像頭)的加持”。
而歸根結底,“場景”才是所有安防服務的核心要素,陳剛就認為要在“用戶可以通過”和“能夠防止攻擊”這兩者之間取得一個平衡。比如在一些不涉及財務及敏感信息的生活娛樂服務中,目前的人臉識別技術已經夠用了,但在支付這樣的場景中,多種驗證方式并行也許才能確保用戶的安全。
在實際應用中還有很多路要走
不同于各個計算機視覺領域內的創業公司,微軟亞洲研究院一方面專注于純粹的技術研究,另一方面也借助自己龐大的業務線面向全球的普通用戶率先推出了一些相關的應用嘗試,Windows Hello就是其中一項重要的功能。如果你用過Surface Pro 4這款平板電腦產品,那你一定使用過由Windows Hello所提供的面部識別解鎖功能,不需要手動輸入密碼,只需雙眼平視攝像頭就能在大概一兩秒內解鎖電腦。雖然在一些光線條件限制的情況下會出現識別失敗的情況,但總體的使用體驗已經基本能滿足用戶的需求了。“在商用電腦的使用場景下是一個相當牢靠的登錄方式了。”陳剛對本刊說道。
但除了“安防”這個人臉識別技術的天然應用場景之外,作為生物特征識別領域的一項分支技術,人臉識別在其他應用場景中面臨的競爭還有很多。
事實上,自從蘋果在2013年率先在iPhone 5S上開始使用指紋識別解鎖之后,指紋識別直到今天都還是市場及用戶接受度最高的生物特征識別技術。此前,由于沒有配備指紋識別功能,羅永浩在2015年底發布的錘子T2手機就在市場上招來了很多用戶的不滿。
而從“生物特征識別”這個更大的概念來看,除了指紋識別、人臉識別之外,還包括虹膜識別、聲紋識別以及指靜脈識別等多種細分技術。其中,指紋識別、人臉識別和虹膜識別既同屬“圖像識別”,又是目前相對比較成熟的技術,所以他們目前各自在市場上占有一席之地。
盡管三星公司在去年下半年推出的旗艦產品Galaxy Note 7因為爆炸事件掀起了軒然大波,但他們卻是全球第一款使用了虹膜識別技術的大眾級智能手機產品,在今年推出的Galaxy S8中,他們繼續使用了這項技術。相比其他生物特征識別技術,由于虹膜在胎兒發育階段形成后,在人的整個生命歷程中基本保持不變,所以這也決定了虹膜識別擁有極為精確的特點。但作為面向用戶的識別方式,因為虹膜識別要求用戶必須睜大眼睛近距離對準攝像頭,所以它在使用體驗上不夠友好。
鄧亞峰對本刊承認,如果用戶愿意接受使用條件的約束,“虹膜識別的成功率要比人臉識別更高一些”。但它在識別率已經達到實用要求的情況下一直沒有得到大規模應用的重要原因就是“不夠易用”。曠視科技也認為“總體而言,人臉解鎖的速度更快(毫秒級別),體驗更好”。
至于指紋識別,它的優缺點相信大家都有自己的體會。而幾乎所有的人臉識別廠商都強調“非接觸”是人臉識別區別于指紋識別的一大優勢,既有便利性上的提升,同時也是最自然的一種解鎖方式。
但就未來的市場應用來看,究竟哪種技術會成為用戶使用的主流還并不那么確定。
作為手機行業的資深觀察者,蔣鴻杰認為僅就手機而言,如果“屏下指紋技術”能在未來的一兩年之內達到成熟,那它可能會成為更受手機廠商歡迎的方案,畢竟它一方面符合用戶已有的使用習慣,同時也滿足了解放屏幕空間的目的。但如果屏下指紋技術無法在短時間內成熟,“那可能大家就都轉向3D結構光,把指紋拋棄掉”。而IDC中國研究經理金迪則對記者表示,“像人臉識別這樣的生物特征識別技術肯定會是未來的主流趨勢”,她同時認為長遠來看,肯定會有越來越多的硬件廠商加入人臉識別的行列。
微軟作為更加專注于研究方向的大公司代表則表現得更為謹慎。他們認為從目前來看還很難說會有哪一種技術占據主導地位,更有可能的一種情況是“多種生物識別技術的結合”。
商湯科技聯合創始人、CEO徐立博士認為,推動新的交互方式的重點還是“如何在應用場景中定義問題”,“只有搞清楚了每一個應用場景下使用人臉識別是否能帶來更好的效果,然后在技術層面上實現突破,達到工業應用的紅線,用戶的使用體驗才能獲得平滑的升級”。
而急需解決的最大問題既來自技術上的持續提升,更來自整個產業的探索。但作為一個還處于發展階段的技術,不同的公司各有自己的想法。
“我更認同這樣一種方式,就是要做到垂直領域中,結合這個領域的情況去解決這個領域的問題,而不只是提供一個標準化的人臉識別技術。”鄧亞峰說道。作為一家創業公司,他們覺得自己相比大公司的優勢就是可以深耕某一個細分領域,比較靈活。
徐立給我們舉了一個具體的例子:“例如,它可以用于銀行、餐廳等線下服務行業,針對前來的顧客進行身份識別,當遇到VIP客戶時,便可自動激活后續的定制化服務機制,如此一來,VIP客戶將不需要主動出示VIP會員卡,大大增強了用戶的體驗。”
而微軟這樣的公司則有更開闊的目標。除了“更快更準更安全”的大方向之外,“我們希望我們現在這個AI算法能夠像人一樣去認知周圍的世界,然后成為一個對人類有用的工具,它未來能夠幫助這些設備更智能。”
評論
查看更多