2017年9月13日,蘋果終于發布了全新iPhone 手機——iPhone 8/8s/和iPhone X。
蘋果宣布的同時,還帶來了全新功能,基于iPhone X的Face ID。簡單來說,這個功能就是通過iPhone X的Face來創建你喜歡的3D表情Animojis,當然這些表情可以在iMessage中發送。
而小米也是在12日發布了帶有人臉識別的小米Note3。所以,將這兩個產品放在一起做個簡單的對比,還是有點意思的。先看一下功能,蘋果的人臉支付貌似也是可以用于Apple Pay。
從技術上來看,小米是使用了曠視科技(Face++)的人臉識別算法,據說是使用了活體防御技術以及其他十幾種技術,具體是什么軟件技術,新聞里沒有說。而蘋果則是使用了單獨的A11bionic neural engine芯片,在Iphone7里面已經使用FPGA來進行加速運算了。蘋果還使用了所謂的True Depth攝像頭。另外就是,蘋果號稱人臉識別的準確度高達百萬分之一,這已經是與虹膜識別、靜脈識別相當了。
無論是技術,還是功能,蘋果依舊是獨步天下的。但是,也是給其他手機廠商指明了方向,除了繼續提高人臉識別的準確度之外,還需要有單獨的AI芯片來處理語音、視頻相關的數據運算,也需要在采集數據的component sensor上進行創新。
下面我們來分別看看iphonex和小米note3的人臉識別吧
大屏版小米6人臉解鎖來襲——小米note3:
“用最便宜的價錢,買到最優質的產品。”讓小米贏得了市場上大批用戶的青睞,但是很多人都忘記了小米還有另一個口號:讓每一個人都能享受到科技的樂趣。無疑,高科技帶來的樂趣是層出不窮的,甚至是驚喜不斷。在9月11日,小米手機新品發布會上又讓我們驚喜了一把,其敢于直面iPhone8新品發布會,可以看出小米手機的足夠信心,國產手機并不比iPhone這個國際大品牌遜色。
發布會中不止帶來了小米MIX2,還有小米Note3手機的亮相,此次的小米Note 3的定位是“大號版的小米6”,后置雙攝同樣為雙1200萬變焦鏡頭,前置1600萬美顏相機,還有最勁爆的“人臉識別解鎖”功能,可實現0.1秒快速解鎖,成為首款國內發行的會“認人”的國產手機。
這次為小米提供如此高端智能技術的科技公司是國內一家叫做曠視科技的人工智能公司,因為在人臉識別領域頗有建樹在業內也被稱為Face++。
據介紹,曠視(Face++)提供的人臉智能識別解決方案,可以通過邊框檢測、像素或摩爾紋檢測、反光、扭曲檢測等十幾種技術來有效隔離所有人像翻拍的攻擊。
此款專為小米 Note 3定制的人像智能識別方案,鎖屏時點亮屏幕,僅需用戶看一眼就可以瞬間解鎖。在解鎖速度上,整個刷臉解鎖過程只需 500 毫秒。這種非接觸式的解鎖方式從體感上更是快過指紋解鎖。
同時,基于曠視(Face++)的活體防御技術,小米 Note 3 還將具備金融級別防風險能力,可以有效防止他人通過翻拍照片、翻拍視頻、打印照片等方式盜用用戶設備。所以從整體體驗上看,小米 Note 3 將會給國內發燒友們帶來更為極速和安全的革命性解鎖感受。
人臉識別技術早在2014年就有人提起,安卓推出Android4.0就已經引入了人臉識別解鎖功能。不過當時因識別速度差、進度差被冷落。
真正把它帶入人們視線的,應該是支付寶。在2015年的IT和通信產業盛會CEBIT(漢諾威展會)上,馬云就當眾演示了Smile to Pay掃臉技術,也就是我們說的“刷臉支付”。
其實最近一年以來,國產手機行業里幾乎沒有哪家廠商敢用或者真正的用上了人臉解鎖,為此小米推出首款人臉識別解鎖功能的手機是讓行業為之側目和驚嘆的。
曠視(Face++)成立于2011年,創立近6年來一直致力于打造全球領先的人臉識別、圖像識別和深度學習技術。曠視在技術研發與產品制造中均100%擁有核心自主知識產權,累計擁有超過400件人工智能專項領域發明與專利,在機器視覺領域首屈一指。同時,曠視還擁有全球最大的人臉識別云平臺 Face++ 人工智能開放平臺,在全球已有超過2.1億人使用過 Face++ 的人臉識別數據服務。
2017年6月,《麻省理工科技評論》發布全球50大最聰明公司,曠視(Face++)超越眾多高科技巨頭公司,名列第11位。目前,曠視的智能化產品和解決方案已經在全國 25 個省市實現落地,并幫助金融、安防、零售等多個行業實現了產業升級。
曠視(Face++)云事業副總裁吳文昊則表示:曠視(Face++)成立至今,始終堅持以技術驅動企業成長并積極推進人工智能商業化,其擁有的智能解決方案和智能數據服務覆蓋移動互聯網、金融、安防、地產、零售、辦公等多個重要領域。未來,曠視(Face++)將與其它人工智能行業領導者一道推動人工智能產業的發展,改變我們的生活。刷臉和手機的結合也不會止步于解鎖,曠視Face++目前正在打造一套適配整個手機平臺的智能視覺解決方案,以解決不同手機廠商在圖像增強、相機增強、智能圖像和視頻處理上的需求。
隨著技術的成熟和開放,相信人臉識別很快應用到各大品牌手機,成為普及性技術。
不管你是否意識到,越來越多的人都正在進入刷臉時代。曠視在做的就是要從識別人臉開始,教會機器感知和思考,進而識別萬物,再進而實現真實物理場景的數據化,最終讓機器看懂世界,至少現在,通過曠視和小米的努力我們的手機已經能輕松的認出自己的主人了。
蘋果新機演示人臉解鎖失敗——iphonex:
“iPhone 8的發布會將人臉的應用提升到更高的層次。”國內專注于計算機視覺領域相關研究的創業公司曠視科技(Face++)對本刊說道:“基于iPhone 8的攝像頭,人臉的安全程度會超越解鎖,接近于支付級別。因此,我們非常有理由相信人臉終會代替指紋,成為手機通用的生物認證方案。”
雖然不是所有人都認同這個看法,但有一點毫無疑問,隨著iPhone 8的發布,人臉識別技術正在成為未來短時間內最炙手可熱的技術之一。
簡單來說,人臉識別技術指的是通過比較人臉的視覺特征信息從而進行身份鑒別的技術,既屬于圖像識別,也屬于生物特征識別,是人工智能領域一項典型的細分技術應用。
如果你喜歡自拍,那你一定用過一款名為“Faceu”(激萌)的手機APP,根據第三方機構易觀千帆的數據,其月活躍用戶數已經達到了4100萬,而通過人臉識別技術實現的“動態貼紙”功能是其最大的亮點。為Faceu提供相應技術支持的是國內從事計算機視覺相關研究的創業公司商湯科技,兩個月以前,他們剛剛宣布獲得了4.1億美元的B輪融資,這是截至目前全球人工智能市場單輪最高融資,而人臉識別技術則是其最重要的資產之一。
而在去年年底,曠視科技則已經獲得了1億美元的融資,主要投資者包括富士康和建銀國際。而他們也通過為支付寶等阿里系產品提供面部識別系統為市場所熟知。除此之外,云從科技、依圖科技、深醒科技等人臉識別玩家在近期均獲得了千萬美元級融資,連國內最積極的人工智能旗手李開復也驚嘆這個細分產業“竟然能養活四只獨角獸”(“獨角獸”表示估值達到10億美元以上的初創企業。李開復所指的“四只獨角獸”分別是曠視科技、商湯科技、云從科技和依圖科技)。即使是在這兩年風頭最勁的人工智能行業,這也足夠令人咋舌。
“目前這個領域的投資熱度不減,但還是趨于冷靜的。”市場研究機構IDC人工智能領域分析師劉艷霞這樣對本刊評價人臉識別領域目前的市場投資情況,在他們看來,“熱度不減”是因為在目前市場應用還不是很多的情況下,這個領域還有很多新的應用場景亟待開發,里面有大量的機會存在。“趨于冷靜”則是因為在已有的賽道內已經聚集了不少實力雄厚的競爭者。“在這個時間點,后面加入的一些公司相對來講就處于一個比較劣勢的地位,可能你很難再有機會能夠追趕上來。”鄧亞峰對本刊如此說道,他來自國內另一家計算機視覺領域創業公司格靈深瞳。
根據國海證券研究所行業報告研究院的研究顯示,人臉識別主要應用領域市場規模,公安領域16億以上、交通領域50億以上,金融領域百億級別、教育領域百億級別,在不考慮大安防硬件存量市場的前提下,整體市場規模就達到數百億。
而安防市場的廣闊前景則是人臉識別技術目前的最大戰場。根據中安網數據,中國安防行業市場規模從2012年的3240億元增長到了2016年的5400億元,年復合增長率達到驚人的15%,而其中2016年視頻監控產品的產值就達到了962億元。而這也是云從科技創始人周曦的信心來源,去年他就曾經公開預測“未來5年之內,國內人臉識別的市場規模要達到1000億元”。
來自第三方研究機構的劉艷霞沒有周曦那么充足的自信,她認為單純的“人臉識別”可能達不到1000億的規模,但如果把所有上下游的硬件攝像頭與軟件服務都算上,那就沒問題。“在安防領域,如果算上軟件及人工服務,一個攝像頭的投入可能會達到10萬元,那100萬個攝像頭就有1000億元了,而100萬個攝像頭也就是一、二線城市普通攝像頭投入的規模,所以這樣算的話,一個城市可能就有1000億了。”而如果單純從技術層面來看,“1000億”顯然是一個有些夸大的數字。
格靈深瞳CTO鄧亞峰也對本刊表示:“如果提供的只是核心算法或者提供一些核心的人臉識別設備的話,我覺得這個市場可能沒有到千億這個規模,但它可能帶動的市場也許真的能有這么大。”
政府的支持則是另一股助推劑。2015年以來,政府出臺了多項政策法規,為人臉識別在安防、金融等領域的普及打下了堅實的基礎,掃清了政策障礙。比如2015年4月,中央辦公廳就印發了《關于加強社會治安防控體系建設的意見》,其中提到“未來網絡化精細管理是平安城市和智能交通管理的發展方向”,而人臉識別技術則是這一切實施的重要技術基礎。
同時,政府采買本身也是這個領域目前最重要的收入來源,其中公安系統理所當然地成為大頭,你幾乎可以從每一家相關創業公司的官網上看到他們和不同地區公安部門的合作協議。IDC中國人工智能研究總監張卓此前在接受媒體采訪時曾經表示,為國家安全提供智能監控系統給了這些人臉識別領域的初創企業在起步時的巨大助力。他同時表示,中國每年公共安全預算充裕,這使得這一領域的公司創收也較為容易。
“3·15”的打擊證明它還沒有完全成熟
事實上,作為計算機視覺領域的一個分支,對于人臉識別技術的研究可能至少有50年的歷史,目前可以查閱到的最早一篇論文發表于1967年。但在隨后的二三十年間,相關的研究因為各種條件的限制并沒有太大的進展。“1998年微軟亞洲研究院建院的時候我們第一個成立的組就是視覺計算組,那時候計算機視覺應用非常少,很冷門。”微軟亞洲研究院常務副院長郭百寧博士此前就對本刊記者這樣說道。但到了2012年,深度學習技術的出現才真正讓整個人工智能領域看見了可用的曙光,識別率逐年上升。目前,頂尖的人臉識別算法在“一對一”人臉驗證的場景下準確率已經超過了人類的平均水平。
LFW(Labeled Faces in theWild Home)是國際權威的人臉識別數據庫,它是為了研究非限制環境下的人臉識別問題而建立,里面包含超過1.3萬張人臉圖像。目前,在這個數據庫的測試結果中,幾乎全球頂尖團隊的準確率都超過了99%。“我們在這個數據庫上的識別準確率已經達到了99.7%以上,這個準確率已經比絕大多數人類的識別率要高了。”陳剛對本刊說道,他是微軟亞洲研究院創新工程組首席項目開發經理,目前主要負責人臉識別技術的工程開發工作。
微軟亞洲研究院創新工程組首席項目開發經理陳剛
當然,在測試環境下得到的數據并不意味著人臉識別在技術上已經完全成熟。“要看測試數據集的表達能力是否與目標場景的數據情況和使用要求相匹配”,陳剛解釋道,由于LFW這樣的數據庫中的測試內容是固定的,所以很容易進行有針對性的訓練,“如果現在去做視頻安防類的測試,它的那個數據集就和這個數據是不一樣”。而根據鄧亞峰提供的數據,在更加靠近現實的視頻動態人臉識別場景中,現有的人臉識別也只能在理想場景中達到60%~70%的水平。
作為應用在登錄、安防等領域的技術,是否可靠其實是普通用戶最關心的事,但在年初的央視“3·15”晚會上,人臉識別的相關技術漏洞卻被當眾曝光。在演示過程中,一張他人的靜態自拍照,通過技術處理,可以變成能眨眼睛、能微笑的“偽活人”;而借助3D建模技術,這張自拍照還能讓自己“變臉”成另一個人,輕易騙過登錄系統。一時間,關于人臉識別是否足夠安全的話題也讓很多用戶擔心。
但在這個行業內的專業人士看來,“3·15”晚會所曝光的問題既反映了人臉識別技術上的不夠成熟,也反映了很多應用廠商在技術使用上的不負責任。
從技術上看,目前人臉識別技術主要分為2D人臉識別(包括彩色圖像,紅外圖像)和3D人臉識別。2D人臉識別是在彩色圖像上的識別方法,主要優勢在于檢測數據獲取方式便捷,同時目前算法相對成熟,是目前主流的技術應用方向。但“3·15”晚會上的案例已經暴露了在安全性要求高的場景下,靠單一人臉識別算法來身份驗證的使用方式是不夠安全的。由于人臉在2D維度的投影會使得部分有效信息缺失,所以容易被犯罪分子攻擊。
而3D人臉識別方法是基于人臉3D立體模型進行識別,充分利用立體空間信息,能有效解決2D識別的遮擋以及角度旋轉等識別難點,識別精度較高。傳言iPhone 8將使用的“3D結構光”技術就屬于這一類別。曠視科技工作人員對我們說道:“如果結構光屬實,那這項技術將可以抵御所有的翻拍攻擊手段(例如屏幕翻拍照片、翻拍視頻、紙張打印、相片打印等),因為翻拍攻擊的都是2D人臉畫面,而結構光能有效分辨出2D人臉和3D人臉。”目前3D人臉識別的問題主要在于數據采集相對困難,采集數據量十分巨大,對計算機的計算存儲能力要求較高,在商業化上仍然不夠成熟,但也許會是未來的主要方向。
但更嚴重的問題不在技術本身,而在于如何使用技術。“在有些情況下我們沒有解決好某一些相關的技術,比如活體檢測的相關技術,那可能它就不適合在這樣的場景下去應用,但是有些人可能就要這樣用它,這就會造成一些潛在的風險。”鄧亞峰說道。同時,他也強調人臉識別還不是一項完全成熟的技術,不應該被使用在任何場景下。
而陳剛則認為,從長遠的角度來看,不同的安防場景其實有不同的要求,就需要不同的技術解決方案,所有安防環節都要依賴于場景的要求,有針對性地設計選擇合適的解決方案是一個思路。“我們人臉這個圈子基本有一個共識,就是作為‘人臉’這種生物識別的話,作為單一技術去做高層級安全水平的安防,其實是有挑戰的,提高安全等級的通常做法是結合其他驗證手段、信息一起驗證。”
為支付寶等金融產品提供身份認證服務的曠視科技也持相似的看法,他們認為在單攝解鎖的場景下,他們的技術“已經可以應對大部分的攻擊場景”了,因此用于解鎖是夠用的。然而,“到了支付級的安全程度,則需要依賴硬件(攝像頭)的加持”。
而歸根結底,“場景”才是所有安防服務的核心要素,陳剛就認為要在“用戶可以通過”和“能夠防止攻擊”這兩者之間取得一個平衡。比如在一些不涉及財務及敏感信息的生活娛樂服務中,目前的人臉識別技術已經夠用了,但在支付這樣的場景中,多種驗證方式并行也許才能確保用戶的安全。
在實際應用中還有很多路要走
不同于各個計算機視覺領域內的創業公司,微軟亞洲研究院一方面專注于純粹的技術研究,另一方面也借助自己龐大的業務線面向全球的普通用戶率先推出了一些相關的應用嘗試,Windows Hello就是其中一項重要的功能。如果你用過Surface Pro 4這款平板電腦產品,那你一定使用過由Windows Hello所提供的面部識別解鎖功能,不需要手動輸入密碼,只需雙眼平視攝像頭就能在大概一兩秒內解鎖電腦。雖然在一些光線條件限制的情況下會出現識別失敗的情況,但總體的使用體驗已經基本能滿足用戶的需求了。“在商用電腦的使用場景下是一個相當牢靠的登錄方式了。”陳剛對本刊說道。
但除了“安防”這個人臉識別技術的天然應用場景之外,作為生物特征識別領域的一項分支技術,人臉識別在其他應用場景中面臨的競爭還有很多。
事實上,自從蘋果在2013年率先在iPhone 5S上開始使用指紋識別解鎖之后,指紋識別直到今天都還是市場及用戶接受度最高的生物特征識別技術。此前,由于沒有配備指紋識別功能,羅永浩在2015年底發布的錘子T2手機就在市場上招來了很多用戶的不滿。
而從“生物特征識別”這個更大的概念來看,除了指紋識別、人臉識別之外,還包括虹膜識別、聲紋識別以及指靜脈識別等多種細分技術。其中,指紋識別、人臉識別和虹膜識別既同屬“圖像識別”,又是目前相對比較成熟的技術,所以他們目前各自在市場上占有一席之地。
盡管三星公司在去年下半年推出的旗艦產品Galaxy Note 7因為爆炸事件掀起了軒然大波,但他們卻是全球第一款使用了虹膜識別技術的大眾級智能手機產品,在今年推出的Galaxy S8中,他們繼續使用了這項技術。相比其他生物特征識別技術,由于虹膜在胎兒發育階段形成后,在人的整個生命歷程中基本保持不變,所以這也決定了虹膜識別擁有極為精確的特點。但作為面向用戶的識別方式,因為虹膜識別要求用戶必須睜大眼睛近距離對準攝像頭,所以它在使用體驗上不夠友好。
鄧亞峰對本刊承認,如果用戶愿意接受使用條件的約束,“虹膜識別的成功率要比人臉識別更高一些”。但它在識別率已經達到實用要求的情況下一直沒有得到大規模應用的重要原因就是“不夠易用”。曠視科技也認為“總體而言,人臉解鎖的速度更快(毫秒級別),體驗更好”。
至于指紋識別,它的優缺點相信大家都有自己的體會。而幾乎所有的人臉識別廠商都強調“非接觸”是人臉識別區別于指紋識別的一大優勢,既有便利性上的提升,同時也是最自然的一種解鎖方式。
但就未來的市場應用來看,究竟哪種技術會成為用戶使用的主流還并不那么確定。
作為手機行業的資深觀察者,蔣鴻杰認為僅就手機而言,如果“屏下指紋技術”能在未來的一兩年之內達到成熟,那它可能會成為更受手機廠商歡迎的方案,畢竟它一方面符合用戶已有的使用習慣,同時也滿足了解放屏幕空間的目的。但如果屏下指紋技術無法在短時間內成熟,“那可能大家就都轉向3D結構光,把指紋拋棄掉”。而IDC中國研究經理金迪則對記者表示,“像人臉識別這樣的生物特征識別技術肯定會是未來的主流趨勢”,她同時認為長遠來看,肯定會有越來越多的硬件廠商加入人臉識別的行列。
微軟作為更加專注于研究方向的大公司代表則表現得更為謹慎。他們認為從目前來看還很難說會有哪一種技術占據主導地位,更有可能的一種情況是“多種生物識別技術的結合”。
商湯科技聯合創始人、CEO徐立博士認為,推動新的交互方式的重點還是“如何在應用場景中定義問題”,“只有搞清楚了每一個應用場景下使用人臉識別是否能帶來更好的效果,然后在技術層面上實現突破,達到工業應用的紅線,用戶的使用體驗才能獲得平滑的升級”。
而急需解決的最大問題既來自技術上的持續提升,更來自整個產業的探索。但作為一個還處于發展階段的技術,不同的公司各有自己的想法。
“我更認同這樣一種方式,就是要做到垂直領域中,結合這個領域的情況去解決這個領域的問題,而不只是提供一個標準化的人臉識別技術。”鄧亞峰說道。作為一家創業公司,他們覺得自己相比大公司的優勢就是可以深耕某一個細分領域,比較靈活。
徐立給我們舉了一個具體的例子:“例如,它可以用于銀行、餐廳等線下服務行業,針對前來的顧客進行身份識別,當遇到VIP客戶時,便可自動激活后續的定制化服務機制,如此一來,VIP客戶將不需要主動出示VIP會員卡,大大增強了用戶的體驗。”
而微軟這樣的公司則有更開闊的目標。除了“更快更準更安全”的大方向之外,“我們希望我們現在這個AI算法能夠像人一樣去認知周圍的世界,然后成為一個對人類有用的工具,它未來能夠幫助這些設備更智能。”
評論
查看更多