顧名思義,機器視覺的核心價值,就是代替人眼和人腦對圖像和視頻信息作出感知和分析判斷。雖然機器視覺不算一個新概念,卻在過去的10年中獲得了高速的發展,且在可以預見的未來仍然保持相當的加速度。機器視覺這樣一種發展態勢,得益于三個因素。
第一個因素就是摩爾定律。從硬件的角度來看,一個機器視覺系統包含兩個核心的器件:一個是CMOS圖像傳感器(攝像頭),一個是處理器。而這兩者都是可以通過標準CMOS半導體工藝制造的,因此也就被套上了摩爾定律的的“魔咒”,在似乎永無止境的追求“三低一高”(低功耗、低成本、小尺寸、高性能)的征途上一路狂奔,不斷拉低機器視覺的獲取成本。想一想今天一個入門級手機攝像頭的分辨率,可能和幾年前中高端單反相機圖像傳感器的級別相當,這恐怕就是用戶對摩爾定律作用最直觀的感受了。
摩爾定律同樣在推動處理器性能的提升,使其完全可以勝任復雜的圖像處理計算。在處理器硬件架構的選擇上,今天機器視覺的開發者有多種選擇:可以選擇專門為圖像處理優化的DSP;也可以選擇采用ARM+GPU或其他圖像協處理器的平臺;還有基于ARM+FPGA可編程邏輯的異構處理架構(如Xilinx Zynq 7000)可供使用。即使是主流的ARM通用處理器平臺,配合優化的軟件算法,同樣可以在很多機器視覺應用中施展拳腳。想要獲得性價比更高的機器視覺處理器,對用戶來說只是一個時間問題。
推動機器視覺快速發展的第二個因素,就是日益豐富的算法和軟件資源??梢哉f被摩爾定律“綁架”了的硬件降低了機器視覺的使用門檻,但想真正讓機器像“人眼+人腦”一樣運轉起來,甚至更高能和高效地運轉,就必須要有軟件的配合。在上個世紀,做機器視覺的算法和軟件,絕對是一個燒腦的工作,公司里沒有幾個Ph.D是不敢開張的。這樣的局面從2000年起發生了改變——那一年Intel發布了OpenCV,這是一個基于BSD許可的開源跨平臺計算機視覺庫,開發者通過一系列C/C++函數可以方便地實現很多圖像和視覺處理方面的通用算法。從那時起,基于不斷更新的OpenCV庫,演化出了為不同機器視覺應用而優化的功能和算法,且更容易在嵌入式處理器中移植和運行,由此逐漸形成了完備的機器視覺軟件生態系統。與此同時,很多商業版的軟件開發工具也開始將視覺處理功能集成在其中,令機器視覺的應用開發更加觸手可及。
圖1,安富利提供的Blackfin嵌入式視覺學習開發套件,包括完整的硬件和軟件資源,可以幫助機器視覺開發者快速上手
可以說,硬件和軟件生態環境的成熟,造就了過去十年機器視覺版圖的快速擴張。而接下來,變得更加“智能”,則是機器視覺發展的核心訴求。在這個過程中,第三個要素將發揮至關重要的作用,它就是“人工智能”。利用深度學習等人工智能的核心技術,機器視覺將獲得自我學習演化、不斷迭代增強的能力,越用越“聰明”。
人工智能與機器視覺相結合,比較經典的做法就是將采集到的數據傳輸到云端,在云端訓練出一個具有數據分析判斷和自我學習進化能力的最強“大腦”。與此同時,今天也有人在考慮,依托性能日益強大的機器視覺終端的能力,直接對終端進行訓練,讓深度學習的算法在終端產品上落地,以獲得更好的實時、準確率、可靠性,也避免了在云端可能存在的隱私安全等方面的問題。無論是哪種思路,其成功的應用,無疑都會對機器視覺的未來產生深遠的影響。
總之,在機器的世界里,人類眼睛的工作——至少是部分工作——已經成了簡單重復性的“力氣活兒”,在諸多要素的合力下,機器視覺代替甚至超越人類視覺的進程,已經停不下來了。
-
摩爾定律
+關注
關注
4文章
634瀏覽量
79089 -
機器視覺
+關注
關注
162文章
4384瀏覽量
120419
原文標題:港真:你能“看見”的,比你看見的多得多!
文章出處:【微信號:AvnetAsia,微信公眾號:安富利】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論