這一次,并不是AI主動選擇的舞臺,而是時代的舞臺選擇了AI。
突然爆發并迅速蔓延的新冠疫情下,AI充分展現出了它在人類經歷重大疾病災害時,協助人類應對突發事件的重要價值。AI在公共視野的案例,也成為我國AI應用“多點開花”的一個縮影。如果說這場疫情是對各行各業的大考,AI這位“考生”,臨場發揮可圈可點。在這場戰疫終于看到曙光的時候,不妨來盤點一下,AI是如何被選中,其價值又是如何與剛需結合并走向普及化。
3月19日,電子發燒友的線上直播以“口罩人臉識別、智能測溫,AI助力抗疫裝備升級”為主題,邀請了百度AI技術生態部高級產品經理吳延宇、OPEN AI LAB(開放智能)產品總經理孫健峰、智慧眼公共安全技術部經理/公共安全產品總監王飛,由電子發燒友分析師張慧娟主持,就疫情下AI的挑戰、典型應用場景、價值、以及未來的方向等話題進行了深入探討,三位嘉賓分享了各自的思考和精彩觀點。本次活動參會人數達到9418人。
如何同時解決體溫精準檢測和戴口罩識別兩大關鍵難題?
百度AI技術生態部高級產品經理吳延宇認為,難度首先在于戴口罩會導致面部信息丟失嚴重,會對常規的人臉識別精度造成很大影響。另外由于口罩的種類、顏色、造型有很多,甚至大家佩戴的習慣和方式也不一樣,再加上護目鏡等等,都給戴口罩人臉識別增加了難度。百度通過算法擬合等手段,在未佩戴口罩的圖片上繪制口罩增加訓練數據,即讓算法見到更多的戴口罩數據;另一方面,讓算法從關注臉部的全部區域特征,改成重點關注眼部這些未遮擋區域,從而減少佩戴口罩的影響。
百度AI技術生態部高級產品經理吳延宇
高精度的體溫檢測主要解決了三個問題:第一是測溫傳感器的零漂基準,模塊的測溫效果一致性問題;第二是測溫模組在不同溫度環境下的溫漂問題,以及設備內部溫度上升的溫度補償;第三是在測溫范圍內進行二次曲線擬合提升測溫的精度,并且長時間使用后的二次曲線系數變化時的問題,這點通常需要黑體配合校準,或是在設備內部做恒定的溫度源校準。
OPEN AI LAB(開放智能)產品總經理孫健峰認為,要同時實現戴口罩識別和高精度測溫需要克服三大挑戰:首先在業務邏輯上要對齊紅外攝像機和RGB可見光攝像機兩個邏輯,特別是在人員數量比較多的時候,如何能夠測到真正需要被測的位置。比如額頭這個指定區域,通過算法進行加權測出相對穩定的溫度。第二是算法邏輯方面,如何在沒有足夠多數據的情況下進行小樣本訓練,是業內比較大的一個挑戰。通過增廣數據,特別是基于Loss函數,通過小數據獲取可以支持機器學習的大樣本數據量來獲取自我迭代。第三在于產業化落地,他認為瓶頸并非來源于技術本身,而是在于技術真正產業化落地時,需要實現的高性價比和產業鏈的分工協同。這需要算法高效地運行在各種硬件平臺上,和足夠長的產業鏈條形成深度合作,這是整個產業鏈需要解決的問題。
OPEN AI LAB(開放智能)產品總經理孫健峰
智慧眼公共安全技術部經理/公共安全產品總監王飛談到,對戴口罩的人臉識別可拆解為兩步,首先判斷有沒有戴口罩,如果沒有就進行模擬戴口罩的提取;如果有則再進行精確化,對這個人的關鍵點進行定位、分割以及識別。在這兩個情況下做對應的閾值調整,可在戴口罩露出鼻尖的情況下達到99%的識別率。
智慧眼公共安全技術部經理/公共安全產品總監王飛
實現測溫的精準度方面,首先測溫的部位是額頭,因此進行人臉識別時先對額頭進行定位,再傳達給感知設備,做到了在鏡頭內人臉跟隨多次測溫,降低了測溫精度的偏差。其次,為了達到大范圍應用,包括高密集的應用,目前主要受距離的影響較大,感溫距離在超出2.5米左右會有較大的溫差。下一步,在改進算法的同時,一些作為硬件設備基礎的感知設備升級,以及無接觸距離的提高,都將對生產的應用價值有很大提升。
應用場景、方案類型、關鍵設備有哪些?
人臉識別+體溫檢測目前主要有哪些方案類型和典型應用場景?從系統構成上來講,需要哪些關鍵設備支撐?孫健峰解釋,當前的人臉識別+體溫檢測設備大概分兩類:第一類比較簡單,可以理解為平板機的形式,通常是人臉識別門禁,其系統構成包括前端感知+算法+主板+外置等。其中,前端感知層有兩類:一類是紅外測溫,另一類是RGB可見光攝像頭,來獲取人的圖片信息,二者配合進行活體識別和身份驗證。第二類是單體式的嵌入式設備形態,廣泛存在于人流密集的地方,前端是雙目攝像頭(包括紅外攝像頭和可見光攝像頭),進行快速的人員檢測、抓拍、識別,在邊緣或終端上進行業務和算法邏輯的實現,并且通過統一的接口傳到后端平臺。這類嵌入式設備的配置方式很靈活,比如用于機器人無人值守、自巡邏甚至無人機。不過應用于無人機時雖然遠距離測溫業務邏輯和產品形態上可以實現,但是技術挑戰主要在于人的身份識別和溫度區間的確認。
王飛認為主要有兩大應用場景:一種是需要快速篩查,像地鐵、商場、園區等;另一種是一人一證、需要實名認證,如海關、酒店、車站等。智慧眼主要面向需要快速進行高溫篩查、或是快速進行閘機辦理的場景。后者基本采用人證圖片測溫一體機,根據不同的應用場景進行檢查。關鍵設備包括可見光攝像機、測溫儀,再加上智能識別系統,以及大數據關聯分析等,通過這些關鍵要素完成高溫篩查及追蹤管控。
吳延宇解釋了兩個不同場景下的特點和需求:一類是密集人流下的多人場景,排查效率要求較高,現在的方案采用多人臉抓拍機+終點距離的測溫設備。它的構成主要是俯視角度的網絡攝像頭,由于視角有限,所以測溫距離一般在3米左右效果較好。另外一個典型場景是單人的近距離身份核驗,一般是平視的角度,距離比較近,比如園區閘機、社區人臉門禁等,使用人臉識別平板+單人的測溫鏡頭,技術難點在于需要兼顧身份核驗,同時也要完成戴口罩的人臉識別,測溫距離通常為30-80厘米為主。關鍵設備一般是RGB可見光視頻相機或人臉抓拍機,加上遠紅外的熱感應模組,實現多人臉的測溫,人臉識別的抓拍更多是為了溫度的校準。近距離場景通常采用雙目攝像頭加中短距離的測溫方案,主要完成單人測溫和身份核驗,核心是測溫傳感器,一般業內采用邁來芯、海曼等公司的模組,解決測溫的精度問題,也會利用黑體來實現校準。
他補充,戴口罩人臉識別在單人的近距離身份核驗中是剛性需求,雖然很多社區已有一些人臉庫,但是在注冊時使用的是不戴口罩的人臉數據,因此難點在于如何在不修改原有的人臉數據時,保證戴口罩下的識別率。此外,單人臉和多人臉精確的檢測和跟蹤,定位人臉的位置,加上對測溫準確度的輔助,還有無接觸的中遠距離的測溫、近距離的測溫等功能都在實際應用層面得到了實實在在的反饋。
可見光+紅外雙光方案還有哪些提升空間?
目前的人臉識別+測溫方案多數都是可見光+紅外雙光系統,未來如何提升?確保測溫和定位、測溫數據和人臉信息更準確、及時地匹配?王飛從人臉識別算法云邊端一體化的實現角度談到,需要在端側把算法融入到設備中,讓端側具有大腦的信息,能夠更好地去適配。另外,需要更多更靈敏的感知模塊融入到前端設備中,這樣在前端就可以提升感知能力和識別的精準度。
吳延宇認為,首先是戴口罩的多人臉場景下如何準確地檢測到人臉,需要將測溫區域和人所在的區域,做到很好的匹配,這樣整體的識別精度就會好很多。第二是輔助背景分割、人體關鍵點的算法,對這個區域進一步做預處理。在保證精度的情況下,硬件方面提升紅外測溫的幀率,采用NTP對時或同步出發的方案,減少測溫目標移動帶來的相位差。總的來說,AI算法在其中就是鎖定被測目標的具體測溫位置,更好地將紅外設備的溫度區域和需要測溫的區域做好匹配。
孫健峰認為紅外攝像頭和RGB攝像頭的校準,特別是自動化校準,不論是技術維度還是工程維度的提升,都會成為獨到的競爭力。實現方案可能會有多種,比如基于人臉框的校準,基于圖像中更多關鍵位置的校準,如何通過視覺的后臺分析,將兩個不同攝像頭的圖片位置進行針對性地校準、對齊,這樣紅外識別的額頭區域位置,和真實的在RGB人臉抓拍下的位置,就能有針對性地實現對齊。
疫情突發,如何在短時間迅速推出解決方案?
吳延宇介紹,百度在人臉檢測與抓拍、口罩識別方面,有長期的算法和經驗積累;同時,內部的AI軟硬件團隊,能夠快速地開發和驗證多種測溫硬件方案,并且結合AI算法,進行場景化的調試和調優,從而快速實現基于測溫傳感器的高精度測溫方案。正是基于算法和軟硬件結合的完整研發鏈,百度能夠快速提供多人臉/單人臉的測溫方案,以及戴口罩下的人臉識別,綜合的人群跟蹤和身份識別方案,并且在高鐵站、地鐵站、社區門禁、園區閘禁方面,快速地實現場景化落地。
孫健峰從定義研發應用的閉環流程談起,首先是業務需求側的驅動下,進行底層硬件的選型,包括底層芯片以及對應的載體平臺;然后通過數據的自動化/半自動化標注,實現算法的快速訓練;之后對算法和硬件進行適配部署及調優,這一工作和硬件、嵌入式算法、框架高度相關,在這個過程中,能夠大幅提升算法在對應硬件上的運行速度和精準度;再往下就是業務派發,實現產業化落地。OPEN AI LAB實現了平臺化的能力,即從算法的維度,對底層各類硬件平臺做了全系列兼容,從而能夠快速實現一個算法化芯片的快速部署能力。
王飛結合智慧眼的研發經驗介紹,在疫情前已經在醫療、交通、海關等場景實現了手持式的人臉識別應用,只不過是在沒有戴口罩的情況下。疫情發生后,針對了人臉識別做了大量的優化,大約用了2周時間,實現了人臉識別的同時能夠測體溫。
人臉識別落地的挑戰?今年看好哪些應用?
王飛結合視覺方面的應用談到了人臉識別存在的挑戰,例如基于視頻分析時容易受到外界因素的干擾,比如光照條件、人的行走姿態、拍攝角度、以及運動狀態下的模糊等,這些還需技術上繼續去攻克難題。他認為現階段最需要立法的支持,規范在商業公司或是非政府行業的應用,相對高涉密的還需要在安全方面探討技術以外的挑戰。從大的行業應用并結合智慧眼的領域來看,王飛認為,安防、民生、養老、醫療保障等領域的應用發展會更快。
孫健峰認為人臉識別要進一步實現大規模的產業化落地,最大的限制是在非常多的差異化場景下的魯棒性,比如如何突破在過度曝光、逆光等非常細分的工程場景下的限制。具體如何去優化?正如AI商業層面以人為核心的“千人千面”,每一個智能化的設備也是差異化的,需要基于一個大模型以及它所處的場景去適配它,提升魯棒性。例如要識別一個處于逆光狀態下的攝像頭拍攝到的人像,可以通過一套自動化的程序,對采集到的數據進行二次訓練,并把對應算法下發到這個設備上,這樣就實現了智能設備的“千人千面”。
隱私保護和數據安全是孫健峰看到的第二大挑戰。一方面需要國家或相關部門牽頭,制定邊界限制和相應規范;另一方面從技術的維度,通過分散式的聯邦學習進行算法訓練是當前的一個解決思路。即:無需把前端隱私數據傳到后端,而是基于這些數據在前端的算力上訓練出小的參數模型,并且把這個模型貢獻到集群中心,通過成千上萬的小的終端獲取到足夠好的綜合算法,再把這個算法下發到前端,這樣既保證了足夠好的準確性,同時保障了隱私和數據安全,這將是未來的一個發展趨勢。
他認為人臉識別應用現在已經非常成熟了,下一步要解決的就是性價比。只有把單點的智能化成本降下來,其體系化的復制和網絡節點的擴展空間才更大。未來,人臉識別應用更多扮演敲門磚的角色,除了在人員管控方面進行有效識別、輔助監督之外,會在很多傳統行業實現產業化落地,比如農業、電力、鋼鐵甚至養殖行業,來幫助提升效率,降低成本。
吳延宇認為人臉識別落地有三大難點:第一是場景的泛化能力。這包括幾個要點:場景的環境條件,例如暗光、逆光、陰陽光等;大面積遮擋,比如戴口罩,還有側面、俯視、仰視,還有模糊、分辨率低等情況,這都會影響圖片獲取時的效果;還有年齡的跨度,從幼兒園的小朋友到八九十歲的高齡老人,算法需要具備很好的年齡跨度的分化性;還有膚色問題,不同人群的膚色識別精度有限,這對于進一步擴展全球市場存在一定挑戰;還有活體檢測的能力,針對高仿模具、高仿面具,還有一些成本很高的硅膠做出來的人像,對于這種級別的攻擊,人臉識別如何去抵御?或是如何輔助硬件和一些策略去抵御攻擊,這方面還存在挑戰。
第二在于精度問題,超大庫檢索雖說安防領域已經用了很久了,但是對于幾十萬、百萬甚至千萬量級的檢索,直接做到一比一千萬、一比三千萬,在精度方面還是有問題的。例如要實現人臉支付在軌道交通方面,如何在不需要任何輔助操作的情況下,就能實現刷臉直接扣費,也是一個挑戰。
第三就是行業標準,包括軟硬件規范、接口規范、架構規范、交付標準規范等等,只有這些規范的陸續出臺,才能保證整個行業進一步蓬勃發展。
今年所看好的應用,吳延宇主要認為包括:智慧通行。例如社區門禁、園區訪客管理、樓宇的人臉門禁閘機等,這些還會更進一步地火起來,需求會更加廣泛、更加深入,實現更穩定的、更精準的應用。第二類是軌道交通。包括高鐵、機場、各種公共設施,以及交通運輸行業,例如駕駛員的行為分析(瞌睡、打電話、疲勞提前監測等),地鐵和公交的人臉支付也會成為熱點。第三類是民事辦理。例如遠程社保的身份證明,或民政大廳的自助機,這些都會進一步得到廣泛應用。涉及到3D識別、RGB、NIR的跨模態識別,還有AI鏡頭等等,這些技術都存在一定的應用機會。
疫情中AI落地帶來哪些啟示?
如何看待疫情中AI所發揮的價值?這對于在落地方面一度遭遇瓶頸的AI技術有哪些啟示?吳延宇認為AI的價值主要體現在三方面:首先傳統的測溫方式,在無接觸情況下,一是無法精確鎖定到人體的固定區,二是難以進行動態跟蹤測溫,尤其是人群密集的場景下。通過AI技術,實現了結合人體、人臉的相關算法,配合一定的業務策略,解決了測溫的準確率和有效性問題。第二,口罩下的人臉識別應用,能夠確保在需要身份核驗、同時又需要測溫的場景下,快速進行核驗和排查,提高了防疫整體的效率和安全性。第三,如OCR文字識別、語言技術識別、肺部的影像篩查等技術,在疫情中也推進了相關的落地,在病毒的基因分析方面,百度在疫情發生后迅速開放了AI算力給相關的科研機構,提升了醫療科研工作的效率。
孫健峰結合AI產業化的特點談到,從2015年開始,國內AI技術真正實現了產業化的落地和部署,早期AI產業化的特點更多是端到端的,大家也以此為傲,既能做芯片又能做算法,還能做應用和行業部署落地。但是在這次疫情中,由于時間非常緊迫,大家更希望整個產業鏈協同分工,各自貢獻自己最擅長的能力。在這個過程中,機器人、視覺、語音等維度都實現了產業化落地。
為什么疫情之下才有這么多的新技術得以落地使用?AI技術還有哪些瓶頸?未來如何更好地去推進產業化?
孫健峰認為疫情對于AI落地最大的啟示就是,如何共同推動AI產業化、分工協同,以及如何更高效、高性價比地實現快速產業化落地。他進一步解釋,當前一個非常嚴峻的問題在于AI落地的成本依舊偏高,從而導致沒有非常迫切的觸發點的時候,AI很難切實地落地到一個細分領域。企業要想做全棧方案,前期投入很高,除非這個行業能夠帶來足夠高的回報率,否則商業邏輯上不可行。但是如果產業鏈能夠高度協同,就像我們現在看到的電腦一樣,做芯片的、做操作系統的、做整機的、做應用軟件的協作起來,整個產業才會高度繁榮,AI在萬千場景下的快速產業化落地,才能更好地實現。
王飛則認為AI未來要向精細化落地的方向發展,這個方向的創新及迭代速度已經在疫情中得到驗證。現實生活的需求在促進技術發展,技術既要著眼于未來,也要落地于現在。如何把技術變成我們生活生產中的工具,成為普通人都用得起、都會用的接地氣的東西。
吳延宇表達了類似的觀點,他認為AI落地過程中的共識,就是要緊貼業務場景特點,做到接地氣,從業務中尋找痛點,才能不斷地解決問題。
觀看本場直播精彩回放,請點擊:http://webinar.elecfans.com/504.html
本文由電子發燒友網原創,未經授權禁止轉載。如需轉載,請添加微信號elecfans999.
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
人臉識別
+關注
關注
76文章
4012瀏覽量
81975 -
紅外測溫
+關注
關注
2文章
195瀏覽量
15031 -
AI2020
+關注
關注
1文章
22瀏覽量
5948
發布評論請先 登錄
相關推薦
基于迅為RK3568/RK3588開發板的AI圖像識別方案
https://www.bilibili.com/video/BV1G54y1A7nf/?spm_id_from=333.999.0.0
迅為RK3568/RK3588開發板AI識別演示方案,包括
發表于 08-28 09:50
人臉識別模型訓練流程
據準備階段,需要收集大量的人臉圖像數據,并進行數據清洗、標注和增強等操作。 1.1 數據收集 數據收集是人臉識別模型訓練的第一步。可以通過網絡爬蟲、公開數據集、合作伙伴等途徑收集
人臉識別模型訓練是什么意思
人臉識別模型訓練是指通過大量的人臉數據,使用機器學習或深度學習算法,訓練出一個能夠識別和分類人臉的模型。這個模型可以應用于各種場景,如安防監
人臉檢測和人臉識別的區別是什么
人臉檢測和人臉識別是計算機視覺領域的兩個重要技術,它們在許多應用場景中都有廣泛的應用,如安全監控、身份驗證、社交媒體等。盡管它們在某些方面有相似之處,但它們之間存在一些關鍵的區別。本文將詳細介紹
人臉識別設備安裝在門上的應用和優勢
1.應用場景人臉識別設備可以安裝在門上,用于實現多種功能,如自動識別員工或學生的身份信息、記錄出入時間、限制未授權人員進入等。這種系統在企業、學校、醫院等單位中得到了廣泛應用,它可以有
開發者手機 AI - 目標識別 demo
功能簡介
該應用是在Openharmony 4.0系統上開發的一個目標識別的AI應用,旨在從上到下打通Openharmony AI子系統,展示Openharmony系統的AI能力,并為
發表于 04-11 16:14
評論