圖像識(shí)別技術(shù)是信息時(shí)代的一門(mén)重要的技術(shù),其產(chǎn)生目的是為了讓計(jì)算機(jī)代替人類去處理大量的物理信息。隨著計(jì)算機(jī)技術(shù)的發(fā)展,人類對(duì)圖像識(shí)別技術(shù)的認(rèn)識(shí)越來(lái)越深刻。圖像識(shí)別技術(shù)的過(guò)程分為信息的獲取、預(yù)處理、特征抽取和選擇、分類器設(shè)計(jì)和分類決策。簡(jiǎn)單分析了圖像識(shí)別技術(shù)的引入、其技術(shù)原理以及模式識(shí)別等,之后介紹了神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù)和非線性降維的圖像識(shí)別技術(shù)及圖像識(shí)別技術(shù)的應(yīng)用。從中可以總結(jié)出圖像處理技術(shù)的應(yīng)用廣泛,人類的生活將無(wú)法離開(kāi)圖像識(shí)別技術(shù),研究圖像識(shí)別技術(shù)具有重大意義。
1、圖像識(shí)別技術(shù)的引入
圖像識(shí)別是人工智能的一個(gè)重要領(lǐng)域。圖像識(shí)別的發(fā)展經(jīng)歷了三個(gè)階段:文字識(shí)別、數(shù)字圖像處理與識(shí)別、物體識(shí)別。圖像識(shí)別,顧名思義,就是對(duì)圖像做出各種處理、分析,最終識(shí)別我們所要研究的目標(biāo)。今天所指的圖像識(shí)別并不僅僅是用人類的肉眼,而是借助計(jì)算機(jī)技術(shù)進(jìn)行識(shí)別。雖然人類的識(shí)別能力很強(qiáng)大,但是對(duì)于高速發(fā)展的社會(huì),人類自身識(shí)別能力已經(jīng)滿足不了我們的需求,于是就產(chǎn)生了基于計(jì)算機(jī)的圖像識(shí)別技術(shù)。這就像人類研究生物細(xì)胞,完全靠肉眼觀察細(xì)胞是不現(xiàn)實(shí)的,這樣自然就產(chǎn)生了顯微鏡等用于精確觀測(cè)的儀器。通常一個(gè)領(lǐng)域有固有技術(shù)無(wú)法解決的需求時(shí),就會(huì)產(chǎn)生相應(yīng)的新技術(shù)。圖像識(shí)別技術(shù)也是如此,此技術(shù)的產(chǎn)生就是為了讓計(jì)算機(jī)代替人類去處理大量的物理信息,解決人類無(wú)法識(shí)別或者識(shí)別率特別低的信息。
1.1 圖像識(shí)別技術(shù)原理
其實(shí),圖像識(shí)別技術(shù)背后的原理并不是很難,只是其要處理的信息比較繁瑣。計(jì)算機(jī)的任何處理技術(shù)都不是憑空產(chǎn)生的,它都是學(xué)者們從生活實(shí)踐中得到啟發(fā)而利用程序?qū)⑵?a href="http://www.1cnz.cn/analog/" target="_blank">模擬實(shí)現(xiàn)的。計(jì)算機(jī)的圖像識(shí)別技術(shù)和人類的圖像識(shí)別在原理上并沒(méi)有本質(zhì)的區(qū)別,只是機(jī)器缺少人類在感覺(jué)與視覺(jué)差上的影響罷了。人類的圖像識(shí)別也不單單是憑借整個(gè)圖像存儲(chǔ)在腦海中的記憶來(lái)識(shí)別的,我們識(shí)別圖像都是依靠圖像所具有的本身特征而先將這些圖像分了類,然后通過(guò)各個(gè)類別所具有的特征將圖像識(shí)別出來(lái)的,只是很多時(shí)候我們沒(méi)有意識(shí)到這一點(diǎn)。當(dāng)看到一張圖片時(shí),我們的大腦會(huì)迅速感應(yīng)到是否見(jiàn)過(guò)此圖片或與其相似的圖片。其實(shí)在“看到”與“感應(yīng)到”的中間經(jīng)歷了一個(gè)迅速識(shí)別過(guò)程,這個(gè)識(shí)別的過(guò)程和搜索有些類似。在這個(gè)過(guò)程中,我們的大腦會(huì)根據(jù)存儲(chǔ)記憶中已經(jīng)分好的類別進(jìn)行識(shí)別,查看是否有與該圖像具有相同或類似特征的存儲(chǔ)記憶,從而識(shí)別出是否見(jiàn)過(guò)該圖像。機(jī)器的圖像識(shí)別技術(shù)也是如此,通過(guò)分類并提取重要特征而排除多余的信息來(lái)識(shí)別圖像。機(jī)器所提取出的這些特征有時(shí)會(huì)非常明顯,有時(shí)又是很普通,這在很大的程度上影響了機(jī)器識(shí)別的速率。總之,在計(jì)算機(jī)的視覺(jué)識(shí)別中,圖像的內(nèi)容通常是用圖像特征進(jìn)行描述。
1.2 模式識(shí)別
模式識(shí)別是人工智能和信息科學(xué)的重要組成部分。模式識(shí)別是指對(duì)表示事物或現(xiàn)象的不同形式的信息做分析和處理從而得到一個(gè)對(duì)事物或現(xiàn)象做出描述、辨認(rèn)和分類等的過(guò)程。
計(jì)算機(jī)的圖像識(shí)別技術(shù)就是模擬人類的圖像識(shí)別過(guò)程。在圖像識(shí)別的過(guò)程中進(jìn)行模式識(shí)別是必不可少的。模式識(shí)別原本是人類的一項(xiàng)基本智能。但隨著計(jì)算機(jī)的發(fā)展和人工智能的興起,人類本身的模式識(shí)別已經(jīng)滿足不了生活的需要,于是人類就希望用計(jì)算機(jī)來(lái)代替或擴(kuò)展人類的部分腦力勞動(dòng)。這樣計(jì)算機(jī)的模式識(shí)別就產(chǎn)生了。簡(jiǎn)單地說(shuō),模式識(shí)別就是對(duì)數(shù)據(jù)進(jìn)行分類,它是一門(mén)與數(shù)學(xué)緊密結(jié)合的科學(xué),其中所用的思想大部分是概率與統(tǒng)計(jì)。模式識(shí)別主要分為三種:統(tǒng)計(jì)模式識(shí)別、句法模式識(shí)別、模糊模式識(shí)別。
2、圖像識(shí)別技術(shù)的過(guò)程
既然計(jì)算機(jī)的圖像識(shí)別技術(shù)與人類的圖像識(shí)別原理相同,那它們的過(guò)程也是大同小異的。圖像識(shí)別技術(shù)的過(guò)程分以下幾步:信息的獲取、預(yù)處理、特征抽取和選擇、分類器設(shè)計(jì)和分類決策。
信息的獲取是指通過(guò)傳感器,將光或聲音等信息轉(zhuǎn)化為電信息。也就是獲取研究對(duì)象的基本信息并通過(guò)某種方法將其轉(zhuǎn)變?yōu)闄C(jī)器能夠認(rèn)識(shí)的信息。
預(yù)處理主要是指圖像處理中的去噪、平滑、變換等的操作,從而加強(qiáng)圖像的重要特征。
特征抽取和選擇是指在模式識(shí)別中,需要進(jìn)行特征的抽取和選擇。簡(jiǎn)單的理解就是我們所研究的圖像是各式各樣的,如果要利用某種方法將它們區(qū)分開(kāi),就要通過(guò)這些圖像所具有的本身特征來(lái)識(shí)別,而獲取這些特征的過(guò)程就是特征抽取。在特征抽取中所得到的特征也許對(duì)此次識(shí)別并不都是有用的,這個(gè)時(shí)候就要提取有用的特征,這就是特征的選擇。特征抽取和選擇在圖像識(shí)別過(guò)程中是非常關(guān)鍵的技術(shù)之一,所以對(duì)這一步的理解是圖像識(shí)別的重點(diǎn)。
分類器設(shè)計(jì)是指通過(guò)訓(xùn)練而得到一種識(shí)別規(guī)則,通過(guò)此識(shí)別規(guī)則可以得到一種特征分類,使圖像識(shí)別技術(shù)能夠得到高識(shí)別率。分類決策是指在特征空間中對(duì)被識(shí)別對(duì)象進(jìn)行分類,從而更好地識(shí)別所研究的對(duì)象具體屬于哪一類。
3、圖像識(shí)別技術(shù)的分析
隨著計(jì)算機(jī)技術(shù)的迅速發(fā)展和科技的不斷進(jìn)步,圖像識(shí)別技術(shù)已經(jīng)在眾多領(lǐng)域中得到了應(yīng)用。2015年2月15日新浪科技發(fā)布一條新聞:“微軟最近公布了一篇關(guān)于圖像識(shí)別的研究論文,在一項(xiàng)圖像識(shí)別的基準(zhǔn)測(cè)試中,電腦系統(tǒng)識(shí)別能力已經(jīng)超越了人類。人類在歸類數(shù)據(jù)庫(kù)Image Net中的圖像識(shí)別錯(cuò)誤率為5.1%,而微軟研究小組的這個(gè)深度學(xué)習(xí)系統(tǒng)可以達(dá)到4.94%的錯(cuò)誤率。”從這則新聞中我們可以看出圖像識(shí)別技術(shù)在圖像識(shí)別方面已經(jīng)有要超越人類的圖像識(shí)別能力的趨勢(shì)。這也說(shuō)明未來(lái)圖像識(shí)別技術(shù)有更大的研究意義與潛力。而且,計(jì)算機(jī)在很多方面確實(shí)具有人類所無(wú)法超越的優(yōu)勢(shì),也正是因?yàn)檫@樣,圖像識(shí)別技術(shù)才能為人類社會(huì)帶來(lái)更多的應(yīng)用。
3.1神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù)
神經(jīng)網(wǎng)絡(luò)圖像識(shí)別技術(shù)是一種比較新型的圖像識(shí)別技術(shù),是在傳統(tǒng)的圖像識(shí)別方法和基礎(chǔ)上融合神經(jīng)網(wǎng)絡(luò)算法的一種圖像識(shí)別方法。這里的神經(jīng)網(wǎng)絡(luò)是指人工神經(jīng)網(wǎng)絡(luò),也就是說(shuō)這種神經(jīng)網(wǎng)絡(luò)并不是動(dòng)物本身所具有的真正的神經(jīng)網(wǎng)絡(luò),而是人類模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)后人工生成的。在神經(jīng)網(wǎng)絡(luò)圖像識(shí)別技術(shù)中,遺傳算法與BP網(wǎng)絡(luò)相融合的神經(jīng)網(wǎng)絡(luò)圖像識(shí)別模型是非常經(jīng)典的,在很多領(lǐng)域都有它的應(yīng)用。在圖像識(shí)別系統(tǒng)中利用神經(jīng)網(wǎng)絡(luò)系統(tǒng),一般會(huì)先提取圖像的特征,再利用圖像所具有的特征映射到神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像識(shí)別分類。以汽車拍照自動(dòng)識(shí)別技術(shù)為例,當(dāng)汽車通過(guò)的時(shí)候,汽車自身具有的檢測(cè)設(shè)備會(huì)有所感應(yīng)。此時(shí)檢測(cè)設(shè)備就會(huì)啟用圖像采集裝置來(lái)獲取汽車正反面的圖像。獲取了圖像后必須將圖像上傳到計(jì)算機(jī)進(jìn)行保存以便識(shí)別。最后車牌定位模塊就會(huì)提取車牌信息,對(duì)車牌上的字符進(jìn)行識(shí)別并顯示最終的結(jié)果。在對(duì)車牌上的字符進(jìn)行識(shí)別的過(guò)程中就用到了基于模板匹配算法和基于人工神經(jīng)網(wǎng)絡(luò)算法。
3.2非線性降維的圖像識(shí)別技術(shù)
計(jì)算機(jī)的圖像識(shí)別技術(shù)是一個(gè)異常高維的識(shí)別技術(shù)。不管圖像本身的分辨率如何,其產(chǎn)生的數(shù)據(jù)經(jīng)常是多維性的,這給計(jì)算機(jī)的識(shí)別帶來(lái)了非常大的困難。想讓計(jì)算機(jī)具有高效地識(shí)別能力,最直接有效的方法就是降維。降維分為線性降維和非線性降維。例如主成分分析(PCA)和線性奇異分析(LDA)等就是常見(jiàn)的線性降維方法,它們的特點(diǎn)是簡(jiǎn)單、易于理解。但是通過(guò)線性降維處理的是整體的數(shù)據(jù)集合,所求的是整個(gè)數(shù)據(jù)集合的最優(yōu)低維投影。經(jīng)過(guò)驗(yàn)證,這種線性的降維策略計(jì)算復(fù)雜度高而且占用相對(duì)較多的時(shí)間和空間,因此就產(chǎn)生了基于非線性降維的圖像識(shí)別技術(shù),它是一種極其有效的非線性特征提取方法。此技術(shù)可以發(fā)現(xiàn)圖像的非線性結(jié)構(gòu)而且可以在不破壞其本征結(jié)構(gòu)的基礎(chǔ)上對(duì)其進(jìn)行降維,使計(jì)算機(jī)的圖像識(shí)別在盡量低的維度上進(jìn)行,這樣就提高了識(shí)別速率。例如人臉圖像識(shí)別系統(tǒng)所需的維數(shù)通常很高,其復(fù)雜度之高對(duì)計(jì)算機(jī)來(lái)說(shuō)無(wú)疑是巨大的“災(zāi)難”。由于在高維度空間中人臉圖像的不均勻分布,使得人類可以通過(guò)非線性降維技術(shù)來(lái)得到分布緊湊的人臉圖像,從而提高人臉識(shí)別技術(shù)的高效性。
3.3 圖像識(shí)別技術(shù)的應(yīng)用及前景
計(jì)算機(jī)的圖像識(shí)別技術(shù)在公共安全、生物、工業(yè)、農(nóng)業(yè)、交通、醫(yī)療等很多領(lǐng)域都有應(yīng)用。例如交通方面的車牌識(shí)別系統(tǒng);公共安全方面的人臉識(shí)別技術(shù)、指紋識(shí)別技術(shù);農(nóng)業(yè)方面的種子識(shí)別技術(shù)、食品品質(zhì)檢測(cè)技術(shù);醫(yī)學(xué)方面的心電圖識(shí)別技術(shù)等。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,圖像識(shí)別技術(shù)也在不斷地優(yōu)化,其算法也在不斷地改進(jìn)。圖像是人類獲取和交換信息的主要來(lái)源,因此與圖像相關(guān)的圖像識(shí)別技術(shù)必定也是未來(lái)的研究重點(diǎn)。以后計(jì)算機(jī)的圖像識(shí)別技術(shù)很有可能在更多的領(lǐng)域嶄露頭角,它的應(yīng)用前景也是不可限量的,人類的生活也將更加離不開(kāi)圖像識(shí)別技術(shù)。
圖像識(shí)別技術(shù)雖然是剛興起的技術(shù),但其應(yīng)用已是相當(dāng)廣泛。并且,圖像識(shí)別技術(shù)也在不斷地成長(zhǎng),隨著科技的不斷進(jìn)步,人類對(duì)圖像識(shí)別技術(shù)的認(rèn)識(shí)也會(huì)更加深刻。未來(lái)圖像識(shí)別技術(shù)將會(huì)更加強(qiáng)大,更加智能地出現(xiàn)在我們的生活中,為人類社會(huì)的更多領(lǐng)域帶來(lái)重大的應(yīng)用。在21世紀(jì)這個(gè)信息化的時(shí)代,我們無(wú)法想象離開(kāi)了圖像識(shí)別技術(shù)以后我們的生活會(huì)變成什么樣。圖像識(shí)別技術(shù)是人類現(xiàn)在以及未來(lái)生活必不可少的一項(xiàng)技術(shù)。
-
圖像識(shí)別
+關(guān)注
關(guān)注
9文章
520瀏覽量
38267 -
模式識(shí)別
+關(guān)注
關(guān)注
3文章
45瀏覽量
14331
原文標(biāo)題:圖像識(shí)別的原理、過(guò)程、應(yīng)用前景,精華篇!
文章出處:【微信號(hào):WW_CGQJS,微信公眾號(hào):傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論