我們每天用人臉識(shí)別技術(shù)解鎖手機(jī)、結(jié)賬付款,是那么的自然,但相信很少有同學(xué)深入思考這項(xiàng)技術(shù)背后是怎樣一個(gè)流程。
前面我們說(shuō),計(jì)算機(jī)視覺(jué)是人臉識(shí)別關(guān)系最緊密的技術(shù)。所以我們從這一點(diǎn)入手。
計(jì)算機(jī)視覺(jué),通俗來(lái)說(shuō)就是利用攝像頭等設(shè)備代替人眼,來(lái)獲取圖像,利用計(jì)算機(jī)對(duì)圖像信息進(jìn)行處理,綜合人類的認(rèn)知模式來(lái)建立人類視覺(jué)的計(jì)算理論。
這其中,最難的無(wú)疑是如何處理圖像信息、如何模擬人類的認(rèn)知模式。
為了解決這些問(wèn)題,計(jì)算機(jī)視覺(jué)還引入了圖像處理、模式識(shí)別、圖像理解、圖像生成等學(xué)科的知識(shí)。
圖像處理就是把原始圖像轉(zhuǎn)換成計(jì)算機(jī)更容易識(shí)別的圖像;模式識(shí)別,就是計(jì)算機(jī)判斷自己要識(shí)別的是什么和怎么識(shí)別的過(guò)程;圖像理解,就是對(duì)圖像中描述的景物進(jìn)行分析;圖像生成,舉例來(lái)說(shuō)就是當(dāng)圖像的部分信息缺失時(shí),能夠?qū)⑷笔У男畔⒀a(bǔ)上……
這些都是計(jì)算機(jī)視覺(jué)需要借助的學(xué)科技術(shù)。這里面我們要著重講的是模式識(shí)別,它是一個(gè)獨(dú)立的理論體系,具體到計(jì)算機(jī)視覺(jué)領(lǐng)域的應(yīng)用,它表示將計(jì)算機(jī)表示出來(lái)的圖像和一致的類別進(jìn)行匹配的過(guò)程。
有點(diǎn)懂是吧。在這里為大家通俗解釋一下,所謂“識(shí)別”,就是先認(rèn)識(shí),然后辨別。認(rèn)識(shí)什么?認(rèn)識(shí)的是圖像和從圖像中總結(jié)的目標(biāo)物體的特征。怎么辨別?就是將總結(jié)出來(lái)的特征和自己已經(jīng)掌握的特征庫(kù)進(jìn)行比對(duì),然后才能實(shí)現(xiàn)辨別。
我們?nèi)祟愖R(shí)別一樣物體也是遵循這個(gè)邏輯,先總結(jié)特征,然后比對(duì)。至于前面的“模式”,就有點(diǎn)抽象了,你可以理解為一種規(guī)律,它影響著特征和類型比對(duì)的結(jié)果。
沒(méi)錯(cuò),人臉識(shí)別本質(zhì)上也是這個(gè)過(guò)程。
所以,我們沿著模式識(shí)別的思路,來(lái)看看它的整體過(guò)程:分別為預(yù)處理、特征提取和分類等。我們畫出如下流程圖:
預(yù)處理是第一步,但是這部分工作可能很多很雜,例如減少圖像中的噪聲干擾、提高清晰度、還有包括圖像濾波、變換、轉(zhuǎn)碼、模數(shù)轉(zhuǎn)化等。
特征提取,就是在預(yù)處理后的圖像中,提取對(duì)識(shí)別有明顯作用的特征,并在這個(gè)過(guò)程中降低模式特征的維數(shù),令其便于處理。這是一個(gè)復(fù)雜的過(guò)程,后面我們講到具體方法時(shí)候會(huì)有體現(xiàn);
分類,就是對(duì)提取到的特征值按照一定的準(zhǔn)則進(jìn)行分類,便于決策。
舉個(gè)例子,計(jì)算機(jī)要識(shí)別出這張照片中的男人,當(dāng)它拿到照片時(shí),可能覺(jué)得畫面太暗,先提個(gè)亮度,然后又發(fā)現(xiàn)噪點(diǎn)太多,再做個(gè)降噪……一頓操作后感覺(jué)可以了,再將照片轉(zhuǎn)化為數(shù)字信息,這個(gè)過(guò)程是預(yù)處理。
提取出來(lái)的特征值會(huì)進(jìn)入單獨(dú)的特征空間,因?yàn)檫@樣可以更好地識(shí)別和做分類。接下來(lái),就要對(duì)特征空間里的數(shù)據(jù)進(jìn)行分類了,讓它們眼睛歸眼睛,鼻子歸鼻子,頭發(fā)歸頭發(fā)……基于這些分類好的數(shù)據(jù),計(jì)算機(jī)才可以進(jìn)行識(shí)別判斷和決策。
當(dāng)然,為了方便大家理解這個(gè)邏輯過(guò)程,小編在這里只是舉例粗略地說(shuō)明,可能不準(zhǔn)確,實(shí)際的步驟也是相當(dāng)復(fù)雜的,還要考慮各種干擾的因素,例如圖像的質(zhì)量不清晰、背景復(fù)雜、圖像光照分布不均勻、目標(biāo)姿勢(shì)角度出現(xiàn)扭曲或者佩戴了頭飾、眼鏡以及張了胡須、化了妝等等各種情況。
還有要說(shuō)明的一點(diǎn)是,這個(gè)模式識(shí)別的系統(tǒng)是需要一個(gè)自我訓(xùn)練、學(xué)習(xí)的過(guò)程的,其中最重要的是對(duì)前面分類錯(cuò)誤率的訓(xùn)練(分類器訓(xùn)練),因?yàn)樵谇懊娴姆诸愔校覀儫o(wú)法保證分類的結(jié)果是100%正確的,但必須控制在一定的錯(cuò)誤率之類,這必須通過(guò)大量的訓(xùn)練樣本來(lái)不斷修正,令錯(cuò)誤率符合要求。
好了,基于以上對(duì)計(jì)算機(jī)視覺(jué)模式識(shí)別的討論,我們就可以給出人臉識(shí)別系統(tǒng)的主要功能模塊了:
可能有小伙伴覺(jué)得上面這個(gè)舉出功能模塊太簡(jiǎn)單了,所以我們?cè)倬_一些,給出下面的邏輯架構(gòu)圖,相信不難理解:
-
架構(gòu)
+關(guān)注
關(guān)注
1文章
513瀏覽量
25468 -
人臉識(shí)別
+關(guān)注
關(guān)注
76文章
4011瀏覽量
81862
原文標(biāo)題:PLC編程和繼電器控制,很全面的入門干貨全在這
文章出處:【微信號(hào):GKYXT1508,微信公眾號(hào):工控云學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論