前言
我自己是做算法出身,喜歡思考問(wèn)題的本質(zhì)。比如,AI對(duì)于我們整個(gè)工業(yè)視覺(jué)的本質(zhì)到底是什么。今天我把這個(gè)不僅是我的思考,也是阿丘科技整個(gè)公司的思考分享給大家,供大家參考。但這也是一個(gè)比較初級(jí)的思考,要在以后的實(shí)踐中深化。
今天我講的內(nèi)容包含三個(gè)主題,第一個(gè)是講AI對(duì)于工業(yè)視覺(jué)到底意味著什么;第二個(gè)是我們從整個(gè)技術(shù)發(fā)展周期的角度,看一看工業(yè)AI視覺(jué)發(fā)展的一個(gè)大的路線(xiàn)圖;第三個(gè),也是必不可少的,要談一談我們對(duì)未來(lái)的一個(gè)趨勢(shì)和觀(guān)點(diǎn)的一些理解。
AI重構(gòu)工業(yè)視覺(jué)
算法
首先我們來(lái)看第一個(gè)主題,AI對(duì)于工業(yè)視覺(jué)算法到底有什么價(jià)值?
傳統(tǒng)算法,我用兩個(gè)關(guān)鍵詞來(lái)定義它,就是定量分析和特征工程。特征工程就是算不同的特征。后面做判斷的時(shí)候,一堆的if···else···是傳統(tǒng)算法的一個(gè)特點(diǎn)。那AI這塊的話(huà)大家已經(jīng)很了解了,基于樣本來(lái)做學(xué)習(xí)。我認(rèn)為這是很本質(zhì)的一個(gè)東西。
從功能角度出發(fā),工業(yè)視覺(jué)算法可分為圖像處理、定位、檢測(cè)、測(cè)量、識(shí)別;從算法實(shí)現(xiàn)技術(shù)角度就是分類(lèi)、識(shí)別、測(cè)量三大類(lèi)。本質(zhì)上,工業(yè)視覺(jué)算法將會(huì)或正在被AI全部重構(gòu),當(dāng)然如果涉及到測(cè)量技術(shù),即定量分析技術(shù),傳統(tǒng)算法依然不可或缺。
AI重構(gòu)工業(yè)視覺(jué)算法的價(jià)值體現(xiàn)在以下 3 個(gè)方面:
1. 升維
AI通過(guò)升維來(lái)解決我們的一些復(fù)雜的分類(lèi)和識(shí)別問(wèn)題。包括復(fù)雜的背景、低對(duì)比度、柔性電子、一些強(qiáng)干擾。這些東西原來(lái)傳統(tǒng)方法是沒(méi)問(wèn)題的,但是用AI的話(huà),我覺(jué)得能更加好。這個(gè)點(diǎn)大家是能夠肉眼可見(jiàn)的。后面第二點(diǎn)和第三點(diǎn)可能未必肉眼可見(jiàn),但實(shí)際上是更關(guān)鍵的。
2. 簡(jiǎn)化、通用化
AI的一大優(yōu)勢(shì)是可以對(duì)算法問(wèn)題做極度的抽象,抽象之后較為復(fù)雜的工業(yè)視覺(jué)問(wèn)題就會(huì)變得比較簡(jiǎn)單,還有一個(gè)就是通用化。很多工業(yè)視覺(jué)里面比較復(fù)雜的算法問(wèn)題,用兩到三個(gè)比較通用的算法模塊去訓(xùn)練數(shù)據(jù),結(jié)果就出來(lái)了,并且這個(gè)指標(biāo)還非常優(yōu)秀。
3. 降本
大家聽(tīng)到這個(gè)東西好像有點(diǎn)反直覺(jué),覺(jué)得AI對(duì)算力有要求,怎么還能降本?
我們舉一個(gè)所有做傳統(tǒng)算法的人都能夠理解的一個(gè)例子。比如幾何形狀匹配,這個(gè)屬于是整個(gè)機(jī)器視覺(jué)里面,傳統(tǒng)算法繞不過(guò)的這樣的一個(gè)算法,它需要設(shè)置非常多的參數(shù)。如果要用好,工程師需要理解幾何匹配算法的基本原理、參數(shù)的物理含義,這需要較為專(zhuān)業(yè)的圖像處理背景知識(shí),門(mén)檻要求高。如果你理解不到位,可能定位的結(jié)果不是你想要的,或者達(dá)不到一個(gè)非常精準(zhǔn)的效果。要做到這一點(diǎn)的話(huà),是需要有圖像處理算法背景的。所以說(shuō)我原來(lái)做傳統(tǒng)圖像,就是我在原來(lái)東家的時(shí)候,我們帶著底下的應(yīng)用工程師都是碩士,這個(gè)成本是非常高的。
而我們用 AI 來(lái)做,比如說(shuō)我們只是訓(xùn)練三、五個(gè)樣本,甚至是一個(gè)樣本,后面整個(gè)定位的精度跟效率都能夠達(dá)到,甚至超過(guò)傳統(tǒng)算法的精度。當(dāng)然,整個(gè)魯棒性肯定也比傳統(tǒng)算法要好。那這樣使用的成本就可以降到非常低。
解決方案
這個(gè)解決方案的范疇是什么?可以說(shuō)是視覺(jué)系統(tǒng)范疇,也可以說(shuō)是視覺(jué)檢測(cè)設(shè)備范疇。叫解決方案,就是基于算法疊加的一個(gè)完整方案。我們內(nèi)部的觀(guān)點(diǎn)是,AI不僅僅是一個(gè)技術(shù)模塊,它是一種新的認(rèn)知框架,本質(zhì)上是基于數(shù)據(jù)和標(biāo)準(zhǔn)驅(qū)動(dòng)的。首先我們要有這么一個(gè)認(rèn)知框架,再往下看我們的視覺(jué)解決方案,核心包括哪些部分?對(duì)這些部分意味著是什么?
我抽取了里面三個(gè)核心部分:
1. 成像模組
成像模組就是整個(gè)機(jī)器視覺(jué)里面成像的所有器件跟方案,它背后的基本原理是什么?是基于傳統(tǒng)算法,而傳統(tǒng)算法基于定量分析。所以說(shuō)我們基于傳統(tǒng)算法來(lái)做的成像方案,它的底層要求是“定量、高對(duì)比度”。
這個(gè)會(huì)導(dǎo)致什么樣的后果?比如說(shuō)我們要檢測(cè)一個(gè)表面很多不同類(lèi)型的缺陷。為了要達(dá)到高對(duì)比度的定量,可能我需要打若干場(chǎng)光。可能每場(chǎng)光對(duì)應(yīng)兩種缺陷,后面才能把這些缺陷完整的呈現(xiàn)出來(lái),成像的效率非常低。
而我們進(jìn)入AI時(shí)代以后,我們對(duì)成像的要求變了,只要是目視可見(jiàn)即可。當(dāng)前基于傳統(tǒng)算法構(gòu)建的成像方案,本質(zhì)上還只是一個(gè)“光電轉(zhuǎn)換器”。只是把一個(gè)關(guān)鍵信號(hào)轉(zhuǎn)換成圖像,距離我們所說(shuō)的眼睛差的太遠(yuǎn)了。當(dāng)然,我們也不可能一步躍成眼睛,那至少階段性的目標(biāo)我們是不是可以達(dá)到攝影水準(zhǔn)。這個(gè)做到了有什么好處呢?一方面是能夠提高我們整個(gè)成像的空間效率,更重要的是它簡(jiǎn)化了、通用化了、成本低了。這是很重要的一個(gè)根本變化。
2. 算法模組
客觀(guān)來(lái)說(shuō),當(dāng)前落地的各種項(xiàng)目,成本還是比較高的。根源在于大部分只是把AI作為一個(gè)算法模塊,把它疊加到原來(lái)的體系里面,就比較低效。后續(xù)算法方案一定要以AI為中心,打通和優(yōu)化整個(gè)計(jì)算流和數(shù)據(jù)流,這個(gè)才是最優(yōu)的方式,能夠提高訓(xùn)練推理效率、降低部署維護(hù)成本。
3. 自動(dòng)化模組
在傳統(tǒng)算法時(shí)代,由于成像有很多約束,自動(dòng)化能發(fā)揮的作用非常受限。AI其實(shí)是打破了算法的束縛,本質(zhì)上也打破了我們成像的束縛。可以自動(dòng)化幫我們拍圖,各種“凹姿勢(shì)”“擺造型”。只要能將缺陷拍清楚就可以,并不需要那么明亮的成像。如果這么來(lái)做的話(huà),極大地降低了自動(dòng)化復(fù)雜度,提高了自動(dòng)化通用性。并且能夠比較簡(jiǎn)單高效地解決產(chǎn)品異形、多型號(hào)小批量等成像難題。
從大的維度來(lái)看,工業(yè)視覺(jué)解決方案會(huì)按兩個(gè)極端方向演進(jìn):
- 輕量級(jí)場(chǎng)景:更強(qiáng)調(diào)一體化,極致的簡(jiǎn)單易用,可能需要線(xiàn)上訓(xùn)練。
- 復(fù)雜場(chǎng)景:更強(qiáng)調(diào)通用化解決方案,包括:通用成像模組、通用大模型、通用自動(dòng)化模組,降低全鏈路綜合成本。
工業(yè)AI視覺(jué)進(jìn)化論
任何技術(shù)導(dǎo)入都有它的一個(gè)生命周期,每個(gè)階段有不同的特點(diǎn)。基于落地多個(gè)項(xiàng)目的思考,我們將AI工業(yè)視覺(jué)發(fā)展路徑劃分為三個(gè)階段:早期市場(chǎng)時(shí)期(2019)、保齡球道時(shí)期(2024)、龍卷風(fēng)時(shí)期(2029)。
- 2019年是AI工業(yè)視覺(jué)元年,意味著有相關(guān)的AI項(xiàng)目落地,即早期市場(chǎng)。阿丘也是在這一年開(kāi)始逐步項(xiàng)目落地,我們的第一個(gè)落地項(xiàng)目是3C行業(yè)的模組外觀(guān)檢測(cè)。
- 自 2021年開(kāi)始,AI逐步在各細(xì)分市場(chǎng)成為標(biāo)配,該趨勢(shì)將延續(xù)到2024年,即所謂的保齡球道時(shí)期。阿丘從2021年開(kāi)始在結(jié)構(gòu)件、模組、包裝等眾多細(xì)分市場(chǎng)批量落地。
- 預(yù)計(jì)在 2029年, AI 將在全域市場(chǎng)普及,即龍卷風(fēng)時(shí)期。
這是一個(gè)大概的判斷,時(shí)間周期有可能會(huì)早或晚,僅供大家參考。
早期市場(chǎng)時(shí)期(2019):技術(shù)創(chuàng)新
我們首先來(lái)看一下早期市場(chǎng)有什么特點(diǎn)?
核心還屬于是技術(shù)創(chuàng)新的一個(gè)時(shí)期。換句話(huà)說(shuō),AI這個(gè)東西在工業(yè)視覺(jué)里面到底能不能用,比較專(zhuān)業(yè)的說(shuō)法就叫技術(shù)創(chuàng)新導(dǎo)向。
那么工業(yè)AI算法跟我們自然場(chǎng)景(比如人臉識(shí)別、自動(dòng)駕駛)的技術(shù)到底有什么差別?一是小樣本,大家知道缺陷是由非受控因素產(chǎn)生的,獲取成本很高,所以需要小樣本;二是高精度,包括尺寸小、對(duì)比度低、過(guò)檢率和漏檢率指標(biāo)嚴(yán)格,特別是關(guān)鍵缺陷要達(dá)到零漏殺;三是低算力,本質(zhì)上是由于工業(yè)產(chǎn)品對(duì)成本有約束。
正是基于這些洞察,我們構(gòu)建了自主底層算法框架、上層算法工具,即大家耳熟能詳?shù)墓I(yè) AI 視覺(jué)軟件平臺(tái)AIDI。
在推AIDI的過(guò)程中,有兩個(gè)比較有意思的點(diǎn),在這里與大家分享下:
1、設(shè)備廠(chǎng)商甚至集成商大部分都有自研基礎(chǔ)AI算法的沖動(dòng),基本都無(wú)疾而終。甚至這個(gè)公司可能只有五六個(gè)人,他也安排一個(gè)人來(lái)自研。核心原因就兩個(gè):一是有很多開(kāi)源的框架;二是確實(shí)把這些數(shù)據(jù)拉到框架里充分跑一跑能看到不錯(cuò)的指標(biāo)。但是真正上線(xiàn)時(shí)會(huì)受三個(gè)約束,即小樣本、高精度、低算力。所以很多人可能做到后面無(wú)法突破這三個(gè)約束,慢慢地就悄無(wú)聲息了。
通過(guò)和客戶(hù)的交流和我個(gè)人的思考,我認(rèn)為其實(shí)它是一個(gè)經(jīng)濟(jì)學(xué)問(wèn)題,不是一個(gè)技術(shù)問(wèn)題。我們?cè)趥鹘y(tǒng)算法時(shí)代,用OpenCV去做項(xiàng)目也能做一部分,但是大部分的系統(tǒng)和設(shè)備,還是一定要用專(zhuān)業(yè)的平臺(tái)軟件來(lái)做。在AI這個(gè)時(shí)代我認(rèn)為也是一樣的。能不能自研AI算法呢?我認(rèn)為是比自研傳統(tǒng)算法更難的。主要是三個(gè)方面:第一個(gè)方面,自然場(chǎng)景跟工業(yè)場(chǎng)景的問(wèn)題特性有非常大的差別;第二個(gè)方面是AI算法的參數(shù)維度更多;第三個(gè),要達(dá)到低算力,需要對(duì)算法做高性能優(yōu)化,優(yōu)化復(fù)雜度是非常高的。如果一個(gè)公司真的要自研AI算法,投入的強(qiáng)度要很高,要有很多工程師,所以我覺(jué)得最終它實(shí)際上是一個(gè)經(jīng)濟(jì)學(xué)問(wèn)題。
總的來(lái)說(shuō),如果大家投入資源的強(qiáng)度足夠,我認(rèn)為也能夠做一個(gè)至少能用的東西,但如果要做到更好,就看你有沒(méi)有天花板足夠高的研發(fā)人員。
2、有些人問(wèn)我,做傳統(tǒng)算法的視覺(jué)廠(chǎng)商來(lái)做AI算法是更容易還是更難?針對(duì)這個(gè)問(wèn)題我還真是進(jìn)行了深度的思考,這也是我想給大家分享的第二個(gè)點(diǎn)。其實(shí)我認(rèn)為是更難,可能比一個(gè)完全初創(chuàng)的公司還更難。為什么?本質(zhì)上AI算法和傳統(tǒng)算法的架構(gòu)和迭代方式完全不同,研發(fā)理念也是天壤之別。要從傳統(tǒng)算法的方式切換到AI,我不是說(shuō)沒(méi)有可能,只是概率較小。
阿丘落地的第一個(gè)項(xiàng)目是3C模組外觀(guān)檢測(cè),這個(gè)項(xiàng)目是有一定復(fù)雜度的。其中涉及注塑件、金屬件等多種材料組合,產(chǎn)品異形,缺陷種類(lèi)多達(dá)70余種、形態(tài)多變。 檢測(cè)要求漏檢率低于0.1%,過(guò)檢率3%左右,以傳統(tǒng)算法視角看來(lái)該項(xiàng)目基本無(wú)解。我們從方案到樣機(jī)上線(xiàn)花了超過(guò)6個(gè)月的時(shí)間,在項(xiàng)目進(jìn)行過(guò)程中,我們發(fā)現(xiàn) POC指標(biāo)和上線(xiàn)指標(biāo)之間存在巨大鴻溝。為什么會(huì)有這個(gè)鴻溝?我認(rèn)為主要有四個(gè)方面:
第一個(gè)就是對(duì)AI的認(rèn)知。它到底能解決什么問(wèn)題?不能解決什么問(wèn)題?所謂AI是不論復(fù)雜度的,只要學(xué)習(xí)過(guò)的,再?gòu)?fù)雜也可以解決,沒(méi)學(xué)習(xí)過(guò)的再簡(jiǎn)單也無(wú)法解決。
第二個(gè)是對(duì)需求邊界的認(rèn)知。AI本身無(wú)法分辨正確與錯(cuò)誤,這意味著你給它錯(cuò)誤的樣本,它也會(huì)學(xué)習(xí)。從這個(gè)角度,他對(duì)標(biāo)準(zhǔn)是有很?chē)?yán)格的要求的。
第三個(gè)是對(duì)數(shù)據(jù)的管理。核心主要是兩個(gè)點(diǎn),如何把握標(biāo)注的標(biāo)準(zhǔn)以及如何篩選對(duì)迭代模型有信息量的數(shù)據(jù)。標(biāo)注標(biāo)準(zhǔn)太嚴(yán)苛,成本太高;不夠嚴(yán)苛,標(biāo)準(zhǔn)對(duì)AI來(lái)說(shuō)又不明確。
最后一個(gè)是模型相關(guān)的問(wèn)題。如何保證指標(biāo)的穩(wěn)定性和在產(chǎn)線(xiàn)間進(jìn)行復(fù)制。比如,不同的產(chǎn)品型號(hào)該如何做到兼容。
為了解決這些問(wèn)題,我們基于項(xiàng)目經(jīng)驗(yàn),提煉出了AI落地方法論,比較成熟的方法,就會(huì)成為AIDI產(chǎn)品功能的一個(gè)組成部分。
該階段客戶(hù)的特征:擁抱新技術(shù)、有痛點(diǎn)、有一定支付能力。我認(rèn)為這三個(gè)特征缺一不可。這樣來(lái)看,早期我們項(xiàng)目落地在3C行業(yè)是有其必然性的,因?yàn)橐訟pple為主驅(qū)動(dòng)的3C供應(yīng)鏈?zhǔn)亲钤鐡肀录夹g(shù)的行業(yè)之一。并且在3C供應(yīng)鏈中,自動(dòng)化程度最低的就在質(zhì)檢環(huán)節(jié)。
前幾年疫情引起的人員受限等問(wèn)題更加推動(dòng)了檢測(cè)自動(dòng)化。由于檢測(cè)問(wèn)題的復(fù)雜性,傳統(tǒng)算法時(shí)代實(shí)現(xiàn)檢測(cè)自動(dòng)化可能性非常小。當(dāng)然也做了一些AOI,但實(shí)現(xiàn)的效果不太好,沒(méi)有一個(gè)真正的解決方案。可能你上了一臺(tái)設(shè)備,但還需要更多的人來(lái)維護(hù)這臺(tái)設(shè)備。AI提供了全新的強(qiáng)力的技術(shù)手段,和更多的可能性!
保齡球道時(shí)期(2024):產(chǎn)品創(chuàng)新
早期市場(chǎng)階段,我認(rèn)為是找一些場(chǎng)景落地,后面到了保齡球道時(shí)期,一定是在細(xì)分市場(chǎng)。
這里面的一個(gè)焦點(diǎn)就是產(chǎn)品創(chuàng)新。從算法維度來(lái)看就是算法的標(biāo)準(zhǔn)化,包括工具鏈標(biāo)準(zhǔn)化。把前面說(shuō)的那套落地方法論抽象成一套工具,集成到產(chǎn)品中,讓大家更方便地使用。從解決方案維度,核心點(diǎn)在于創(chuàng)新簡(jiǎn)化。發(fā)掘AI特性,在提高檢測(cè)性能的同時(shí),簡(jiǎn)化成像、算法、自動(dòng)化解決方案,縮短產(chǎn)品上市周期,降低產(chǎn)品生命周期綜合成本。
該階段客戶(hù)的特征:有痛點(diǎn)且關(guān)注性?xún)r(jià)比。我們認(rèn)為這個(gè)階段還需要延續(xù)兩到三年的時(shí)間。
龍卷風(fēng)時(shí)期(2029):行業(yè)價(jià)值鏈重構(gòu)
下一個(gè)時(shí)期就是龍卷風(fēng)時(shí)期,重點(diǎn)在于重構(gòu)行業(yè)價(jià)值鏈。
該時(shí)期的前置條件是殺手級(jí)產(chǎn)品的出現(xiàn),該殺手級(jí)產(chǎn)品把行業(yè)價(jià)值鏈卷一遍,在暴風(fēng)過(guò)后,將會(huì)呈現(xiàn)新的價(jià)值鏈格局。比如,移動(dòng)互聯(lián)網(wǎng)時(shí)代的殺手級(jí)產(chǎn)品就是iPhone。視覺(jué)行業(yè)的殺手級(jí)產(chǎn)品是康耐視的VisionPro,有了這個(gè)產(chǎn)品才定義了我們現(xiàn)在提到的很多術(shù)語(yǔ)。那AI時(shí)代的殺手級(jí)產(chǎn)品是什么?這個(gè)還是需要由市場(chǎng)來(lái)選擇。
龍卷風(fēng)時(shí)期的重要特征:大量“偽AI公司出現(xiàn)”。特別是傳統(tǒng)視覺(jué)公司沒(méi)有涉及AI也紛紛披上AI的外衣,因?yàn)榇蠹叶几兄奖╋L(fēng)即將來(lái)臨,想跟上風(fēng)潮的同時(shí)又恐懼被暴風(fēng)卷走。
演進(jìn)趨勢(shì)觀(guān)點(diǎn)
最后我來(lái)分享下我們對(duì)未來(lái)3-5年AI演進(jìn)趨勢(shì)的一些觀(guān)點(diǎn)。
第一個(gè)是算法方面:第一個(gè)是非監(jiān)督,這個(gè)主要針對(duì)輕量級(jí)場(chǎng)景;第二個(gè)是大模型,前面提到對(duì)于復(fù)雜場(chǎng)景,大模型是最佳機(jī)會(huì);最后一個(gè)是輕量化,即低算力,低成本是工業(yè)視覺(jué)永恒的關(guān)鍵維度。
第二個(gè)趨勢(shì)屬于解決方案。第一個(gè)核心還是簡(jiǎn)化和通用化,前面提到的成像、算法自動(dòng)化都是屬于簡(jiǎn)化、通用化。還有一個(gè)是全鏈路的成本優(yōu)化。這是什么意思?一個(gè)行業(yè)要達(dá)到最大化普及,成本是很關(guān)鍵的一個(gè)因素。整個(gè)鏈條包括硬件、算力、開(kāi)發(fā)成本、部署成本、維護(hù)成本,如何實(shí)現(xiàn)整體最低。
第三個(gè)我認(rèn)為是整個(gè)行業(yè)大的趨勢(shì)。未來(lái)五年左右,一定會(huì)出現(xiàn)殺手級(jí)產(chǎn)品。這個(gè)產(chǎn)品的出現(xiàn)靠能力,也要靠點(diǎn)運(yùn)氣,最終它是由市場(chǎng)篩選出來(lái)。整個(gè)行業(yè)將會(huì)因?yàn)檫@個(gè)殺手級(jí)產(chǎn)品重新洗牌。這個(gè)殺手級(jí)產(chǎn)品的出現(xiàn)將影響什么?我分享一下我個(gè)人的觀(guān)點(diǎn):第一個(gè)就是不了解AI的工程師可能將被淘汰。還有一個(gè)就是傳統(tǒng)的視覺(jué)公司從業(yè)者能不能在大的圖景里面創(chuàng)造價(jià)值,否則也會(huì)被淘汰。這個(gè)我們可以用時(shí)間來(lái)檢驗(yàn)。
-
算法
+關(guān)注
關(guān)注
23文章
4607瀏覽量
92840 -
AI
+關(guān)注
關(guān)注
87文章
30746瀏覽量
268896 -
工業(yè)視覺(jué)
+關(guān)注
關(guān)注
0文章
71瀏覽量
7131
原文標(biāo)題:工業(yè) AI 視覺(jué)進(jìn)化論
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論