【導(dǎo)讀】:最新,眼擎科技eyemore成像引擎隨處可見,讓機(jī)器擁有人眼,真有那么厲害還是吹捧過(guò)度呢?
視覺(jué)“識(shí)別”是人工智能時(shí)代下,對(duì)安防行業(yè)而言最重要的技術(shù)之一,但目前無(wú)論是人臉識(shí)別還是車輛識(shí)別,都面臨著被復(fù)雜光線影響的問(wèn)題,而后端算法只能做到在特定場(chǎng)景、特定光線狀況下,對(duì)物體進(jìn)行有效識(shí)別,可一旦光線發(fā)生了變化,識(shí)別率就會(huì)大打折扣。
“機(jī)器視覺(jué)不能重蹈語(yǔ)音識(shí)別的覆轍。”眼擎科技CEO朱繼志告訴億歐,語(yǔ)音識(shí)別技術(shù)已經(jīng)宣稱識(shí)別率達(dá)到99%,但卻遲遲無(wú)法在生活場(chǎng)景中大規(guī)模應(yīng)用,原因就在于“99%的數(shù)據(jù)是在安靜的實(shí)驗(yàn)室中得出的,而生活場(chǎng)景中有大量的噪音,這對(duì)識(shí)別產(chǎn)生了巨大的干擾。”同理,在視覺(jué)識(shí)別中,攝像頭正常光照下的成像AI識(shí)別率能接近100%,但實(shí)際部署中不可避免會(huì)遇到弱光、逆光、反光等復(fù)雜光的影響,所以現(xiàn)實(shí)中算法識(shí)別率遠(yuǎn)不能達(dá)到實(shí)驗(yàn)室的“理論”效果。
“大腦要強(qiáng),但如果感知端無(wú)法傳輸有效的信息,那么大腦再?gòu)?qiáng)也沒(méi)有用。”針對(duì)當(dāng)前AI成像的問(wèn)題,朱繼志于2014年創(chuàng)立了眼擎科技,研發(fā)超越人眼視覺(jué)能力的成像引擎技術(shù)及芯片,解決數(shù)碼成像在弱光、逆光、反光等復(fù)雜光環(huán)境下成像的痛點(diǎn)。
AI視覺(jué)新問(wèn)題:大腦夠強(qiáng)了,眼睛卻跟不上
在安防領(lǐng)域,每年攝像頭出貨量超過(guò)1億臺(tái),人臉識(shí)別、車輛識(shí)別等算法的成熟持續(xù)帶動(dòng)著安防市場(chǎng)擴(kuò)大,但在實(shí)際應(yīng)用中,“識(shí)別”受到了諸多環(huán)境因素的限制,其中最重要一個(gè)挑戰(zhàn)就是復(fù)雜光線。
“如果將整個(gè)識(shí)別的系統(tǒng)比作一個(gè)人,我們現(xiàn)在已經(jīng)有很強(qiáng)的大腦了,但眼睛卻跟不上。”朱繼志告訴億歐,要對(duì)人臉、車輛進(jìn)行識(shí)別的前提條件,是前端攝像頭能夠傳回清晰的畫面。但現(xiàn)在的問(wèn)題是,在光線環(huán)境足夠好的時(shí)候,“大腦”對(duì)畫面內(nèi)容的識(shí)別率能接近100%;但在弱光、逆光、反光等復(fù)雜光環(huán)境下,由于無(wú)法接收到清晰的畫面,“大腦”對(duì)畫面內(nèi)容的識(shí)別率大打折扣。
為了解決復(fù)雜光問(wèn)題,業(yè)內(nèi)出現(xiàn)了各種各樣的應(yīng)對(duì)方法。針對(duì)黑暗或弱光環(huán)境,可以使用紅外線,或者直接在攝像頭旁加裝一盞燈,“但這些方法只能解決一部分的光問(wèn)題,而且還有’副作用’。”朱繼志說(shuō),紅外線只能在近距離發(fā)揮作用,而且成像噪點(diǎn)大,畫質(zhì)極易受到干擾;而加裝燈的方法只在某些場(chǎng)景下可行,“比如晚上在閘機(jī)口處加裝燈是可行的,但在公路上抓拍車輛的場(chǎng)景卻不合適。”朱繼志說(shuō)道,大多數(shù)司機(jī)都對(duì)夜晚路過(guò)抓拍機(jī)的爆閃燈“有很不好的體驗(yàn)”,但如果不加裝爆閃燈,監(jiān)控設(shè)備就無(wú)法正常捕捉到車輛信息。
解決單一非正常光環(huán)境的方法已經(jīng)不盡如人意了,而前端設(shè)備需要面臨的遠(yuǎn)不止一種光環(huán)境。朱繼志告訴億歐,弱光、逆光、反光等只是復(fù)雜光線下的幾種典型,而大部分在戶外使用的攝像頭需要面臨的卻是多種復(fù)雜光線交替出現(xiàn)的場(chǎng)景。
以閘機(jī)口為例,攝像頭架設(shè)的位置和方向是固定的,但一天中光線的強(qiáng)弱、光源位置都會(huì)發(fā)生變化。“早上太陽(yáng)從東邊升起,傍晚從西邊落下,到了晚上又是黑的。”朱繼志說(shuō),如果攝像機(jī)朝向東方,則早上逆光現(xiàn)象就會(huì)非常嚴(yán)重,朝向西邊也是同理,到了晚上又是弱光,而通常情況下算法只能針對(duì)其中一種狀況作出優(yōu)化,這給閘機(jī)的高效識(shí)別帶來(lái)巨大的挑戰(zhàn)。
打破被日系企業(yè)壟斷的ISP架構(gòu)
不解決弱光、逆光、反光等復(fù)雜光環(huán)境下的自適應(yīng)能力,AI視覺(jué)產(chǎn)品就無(wú)法大規(guī)模落地進(jìn)行產(chǎn)業(yè)化。但要怎么做才能解決這個(gè)問(wèn)題呢?
朱繼志認(rèn)為,這個(gè)問(wèn)題的出路在前端。“無(wú)論是什么樣的光環(huán)境,只要前端設(shè)備面臨負(fù)責(zé)光線對(duì)成像的干擾時(shí),依然能夠輸出如同正常光環(huán)境下成像的效果。那么企業(yè)在后端算法上就不需要再做過(guò)多的定制,如此一來(lái),企業(yè)就能夠生產(chǎn)更多標(biāo)準(zhǔn)化的產(chǎn)品,提升企業(yè)、乃至整個(gè)行業(yè)的效率。”
要改造前端設(shè)備,首先需要了解當(dāng)前攝像機(jī)成像的原理,以及存在的問(wèn)題。
朱繼志介紹道,在數(shù)碼時(shí)代,攝像頭成像需要經(jīng)歷幾個(gè)環(huán)節(jié)。首先,光線穿過(guò)鏡頭后,要經(jīng)過(guò)CMOS傳感器,CMOS會(huì)將光信號(hào)轉(zhuǎn)化為電信號(hào),“但這個(gè)電信號(hào)是很粗糙的,”朱繼志說(shuō),“如果要將它再轉(zhuǎn)化成一張可視化的圖像,就要再經(jīng)過(guò)ISP。”
ISP全稱為Image Signal Processing,即圖像信號(hào)處理,主要用來(lái)對(duì)前端圖像傳感器輸出信號(hào)處理進(jìn)行處理。ISP架構(gòu)能夠通過(guò)一些列的工作,實(shí)現(xiàn)自動(dòng)光圈、自動(dòng)曝光、自動(dòng)白平衡等功能,讓電信號(hào)真正變成一張可看的圖像。
“但傳統(tǒng)的ISP架構(gòu)有兩大問(wèn)題。”朱繼志說(shuō)。第一個(gè)問(wèn)題是所有RAW數(shù)據(jù)在進(jìn)入ISP架構(gòu)時(shí),會(huì)直接從16位被裁成8位,導(dǎo)致了大量RAW數(shù)據(jù)信息丟失。RAW是一個(gè)單獨(dú)的數(shù)據(jù)流,如果16位的信息變成8位,那么再轉(zhuǎn)換成JPG格式圖片時(shí),圖片信息就會(huì)比原始的RAW數(shù)據(jù)信息少256倍。“這就是為什么圖像在逆光、反光等復(fù)雜光環(huán)境下質(zhì)量不高、成像不清晰的原因。”
另一個(gè)問(wèn)題是,ISP架構(gòu)所有核心技術(shù)都被日本企業(yè)掌握。“日本公司是成像行業(yè)的頭部企業(yè),如果他們都不對(duì)ISP架構(gòu)進(jìn)行突破,那其他公司更加不可能做出大的改變。”朱繼志說(shuō)道。
但成像中存在的痛點(diǎn)深深影響著AI視覺(jué)產(chǎn)品的大規(guī)模落地是不爭(zhēng)的事實(shí)。既然無(wú)法改變傳統(tǒng)的ISP架構(gòu),那就一定要在技術(shù)上進(jìn)行創(chuàng)新。秉著這樣的初衷,眼擎科技完全拋棄了日系成像技術(shù)的ISP架構(gòu),打破了日系廠商在成像領(lǐng)域的技術(shù)壟斷,開發(fā)出了全新的“成像引擎”。
從“給人看”到“給機(jī)器看
“如果一個(gè)問(wèn)題存在了很久,都沒(méi)有被現(xiàn)有架構(gòu)解決,這說(shuō)明一定要有全新的技術(shù)架構(gòu)才能破解難題。”朱繼志告訴億歐,眼擎科技開發(fā)的“成像引擎”就是這樣一個(gè)解決復(fù)雜光環(huán)境下AI視覺(jué)成像問(wèn)題的全新架構(gòu)。
“傳統(tǒng)ISP架構(gòu)的目的是為了實(shí)現(xiàn)成像這個(gè)功能,”朱繼志說(shuō),“但成像引擎重視的是成像的性能。”
據(jù)了解,成像引擎是一個(gè)“算力+算法+數(shù)據(jù)”的全新成像架構(gòu),具有學(xué)習(xí)功能。朱繼志向億歐介紹道,處理圖片是一個(gè)十分復(fù)雜的過(guò)程,因此算力對(duì)成像引擎而言十分重要;但光有算力是不夠的,還要開發(fā)出針對(duì)不同場(chǎng)景的算法,才能解決實(shí)際應(yīng)用中的問(wèn)題;在算力和算法都具備的條件下,最終還需要在不同復(fù)雜光環(huán)境下進(jìn)行測(cè)試,以收集到更多的場(chǎng)景數(shù)據(jù),讓算法進(jìn)行學(xué)習(xí),達(dá)到讓整個(gè)成像引擎能夠適應(yīng)多種復(fù)雜光環(huán)境的目的。
在成像引擎實(shí)際運(yùn)作中,“經(jīng)過(guò)CMOS的8~16位RAW數(shù)據(jù)進(jìn)來(lái)時(shí),我們直接基于RAW數(shù)據(jù)進(jìn)行無(wú)裁剪處理,如果按照16位的數(shù)據(jù)來(lái)算,成像引擎處理的原始圖像信息量比傳統(tǒng)ISP高256倍,最后把它壓縮成8位的JPG圖像。”朱繼志說(shuō),這樣的方法能夠保留所有圖像細(xì)節(jié)信息,無(wú)論在什么光線環(huán)境下,都能對(duì)圖像實(shí)現(xiàn)優(yōu)質(zhì)處理。
“顏色是AI測(cè)量世界的根本依據(jù),也是深度學(xué)習(xí)進(jìn)行圖像識(shí)別的基礎(chǔ)。”朱繼志認(rèn)為,成像技術(shù)的目的已經(jīng)從“給人看”過(guò)渡到“給機(jī)器看”,“AI視覺(jué)需要的是一把標(biāo)尺,關(guān)注的不是美顏、像素,而是準(zhǔn)確的輸出物體的顏色、銳度以及豐富的細(xì)節(jié)。”
據(jù)了解目前成像引擎暗光能力比人眼高8倍,降噪能力比攝像頭高64倍,逆光能力比攝像頭高32倍。未來(lái)三年,眼擎科技的使命就是讓成像引擎芯片的成像能力將全方位超越人眼。
AI視覺(jué)的“最后一公里”
今年1月,眼擎科技推出了完全自主研發(fā)的全球首款復(fù)雜光線專用成像芯片eyemoreX42。除了成像芯片,眼擎科技也通過(guò)提供成像開發(fā)套件、成像模組、成像算法IP以及深度定制成像方案等一系列全套的成像技術(shù)方案及服務(wù)。
“我們定位是一家上游的芯片公司。”朱繼志告訴億歐。傳統(tǒng)ISP架構(gòu)集成在SoC里面,而眼擎科技拋棄ISP架構(gòu)后,需要填補(bǔ)成像技術(shù)的空白,但眼擎科技的成像引擎是一個(gè)“算力+算法+數(shù)據(jù)”的全新成像架構(gòu),原來(lái)ISP在SoC中所處的位置無(wú)法承擔(dān)成像引擎的處理能力,“所以我們要單獨(dú)生產(chǎn)一個(gè)芯片來(lái)實(shí)現(xiàn)成像引擎的功能。”
“AI正驅(qū)動(dòng)著芯片產(chǎn)業(yè)發(fā)生變化。”朱繼志告訴億歐,以前CPU一家獨(dú)大,攝像機(jī)里只需要一個(gè)主芯片就能實(shí)現(xiàn)所有功能;但AI時(shí)代來(lái)臨后,GPU的重要性就體現(xiàn)出來(lái)了,所有算法都是基于GPU實(shí)現(xiàn),因此攝像機(jī)中需要加入GPU;但當(dāng)GPU的算力變得很強(qiáng)、算法很豐富的時(shí)候,前端攝像頭能力的好壞就成了AI視覺(jué)“最后一公里”的關(guān)鍵問(wèn)題,因此還需要一款新的成像芯片來(lái)解決這個(gè)問(wèn)題,眼擎科技解決的正是這“最后一公里”的問(wèn)題。
朱繼志表示,眼擎科技的愿景是成為AI成像領(lǐng)域的頭部企業(yè),定位上游的技術(shù)方案商,通過(guò)賦能的方式,向下游打造終端產(chǎn)品的公司輸出自己的成像能力。據(jù)了解,眼擎科技未來(lái)將在安防、工業(yè)檢測(cè)、無(wú)人零售、智能醫(yī)療、機(jī)器人、深度相機(jī)等領(lǐng)域重點(diǎn)發(fā)力。
“我們是面向未來(lái)的,關(guān)注的是新產(chǎn)品和新應(yīng)用市場(chǎng)。”朱繼志告訴億歐,眼擎科技的戰(zhàn)略是先做核心技術(shù)突破,再找市場(chǎng)應(yīng)用部署,“場(chǎng)景與技術(shù)是相互推動(dòng)的,場(chǎng)景的需求能催生技術(shù)的更新,而技術(shù)的創(chuàng)新能’解鎖’更多應(yīng)用場(chǎng)景。”朱繼志說(shuō),比如在安防領(lǐng)域,眼擎的全新成像技術(shù)將變革閘機(jī)的場(chǎng)景,未來(lái)閘機(jī)處的攝像頭不再需要任何輔助光源,也能清晰的“看”見人和物;同樣,“未來(lái)公路上有爆閃燈,可能也會(huì)變成一件奇怪的事。”
今年是眼擎科技啟動(dòng)市場(chǎng)推廣的第一年,朱繼志認(rèn)為,將芯片推向市場(chǎng)需要2年的時(shí)間,之后還要再用2年的時(shí)間等待市場(chǎng)成熟。“AI視覺(jué)成像能力的改變并不是一蹴而就的,而是一個(gè)慢慢迭代升級(jí)的過(guò)程。”朱繼志說(shuō),只講技術(shù)原理,安防圈子的人都懂,但只有看到成像引擎的實(shí)際效果,市場(chǎng)才能對(duì)這個(gè)原創(chuàng)技術(shù)有最直觀的感知,“用戶體驗(yàn)這種主觀的感覺(jué)是很難說(shuō)清楚的,所以還需要時(shí)間讓大家慢慢了解和接受。”
eyemore成像引擎,是否真像口頭說(shuō)得那么厲害,只有到真正商用級(jí)別的時(shí)候才能見真章,更希望中國(guó)IOT大會(huì)中能夠見到眼擎科技帶來(lái)的干貨,在此我們滿懷期待,靜候眼擎科技佳音。
評(píng)論
查看更多