圖像傳感器是把攝像頭接收到的光信號轉化成電子信號的感光元件,可以記錄光場強度的分布,對于拍照設備來說,它就如同人眼的視網膜。手機或者相機的傳感器一般是一個包含了很多個小單元的陣列,每個小單元對應著照片中的一個像素。我們平時說的,相機2000萬像素就是指圖像傳感器上有2000萬個小單元(感光點)。
圖像傳感器單像素成像原理然而,近十多年來,科學家們卻在探索一種新型的“單像素相機”[2],即圖像傳感器只包含一個像素,這種另類的光學成像方式就是“單像素成像”[1]。 那么單像素相機又是怎么工作的呢?單像素成像中,通過一個投影器件不斷向目標物體照射不同的結構光圖案,單像素探測器依次記錄下每次照射時物體場景總體光強度,最后計算重建出具有空間分辨率的物體圖像。數學上來說,單像素探測器記錄的光強度是投影圖案和物體圖像之間的內積。單像素成像與以往常常提到的鬼成像和關聯成像的概念比較接近。
典型的單像素成像系統單像素成像智能處理算法由于單像素相機與普通相機有著不同的成像機制和框架,在最近的研究中,筆者設計了四種為其“量身打造”的圖像智能處理算法。 (1)運動物體單像素成像中模糊去除和質量提升 單像素成像中需要依次投影大量不同圖案,記錄下很長一串單像素值序列,才能重建出一張物體圖像,這顯然需要一定的成像時間。所以,拍攝快速運動的物體時,幀率往往比較低,記錄前幾個單像素值時還“朝發白帝”,記錄后幾個單像素值時就已經“暮到江陵”了。這導致最后記錄下的單像素值數據里包含了不同位置物體的混合信息,重建的圖像會包含比較多模糊和噪聲,類似于普通相機拍攝一輛飛馳而過的汽車得到的“拖尾”照片一樣。 為解決這一問題,可以考慮一個基本的物理定律——運動的相對性,物體在運動,投影圖案是靜止的,等效于物體是靜止的,而投影圖案在反方向運動。物體從左到右運動,相當于投影圖案從右到左運動;物體順時針轉動,相當于投影圖案逆時針轉動。通過搜索估算物體的平移或者轉動速度,對投影圖案做相應的反向變換,然后計算時使用變換后的投影圖案替代原本的投影圖案,重建出的物體圖像就會清晰很多,質量得到明顯提升[3]。
實驗中,拍攝一個快速轉動圓盤上的數字,我們設計的算法可以去除重建圖像中的模糊和噪聲 [3]。 (2)基于單像素成像的全光學物體快速分類 圖像常常需要進行自動分類識別,比如照片里的是一只貓,還是一只狗?一般無論普通相機還是單像素相機,都要先拍攝到物體(比如數字或交通標志)清晰的圖片,才能使用機器學習方法進行圖像分類任務。 不過,筆者提出的基于單像素成像的全光學物體快速分類方案中[4],不需要重建物體圖像,物體只被很少數量的投影圖案所照射,探測器只記錄下“寥寥無幾”的單像素值,該算法直接基于這些單像素值,在“不知道物體到底長得什么樣”情況下,能夠進行快速物體分類。比如我們要把物體分為10類,只需要從大量訓練圖片中優化設計出10個投影圖案,一共投影10次,而進行完整的圖像重建可能需要投影幾百幾千次。
從10個類別的數字圖像和交通標志圖像中分別優化設計出的10個用于快速物體分類的投影圖案(第四行)。 分類結果可以通過單像素值序列中最大光強度值直接顯示出來,無需后續的數字處理,整個系統相當于一個可以進行線性分類任務的“光學計算機”。相比于2018年Science論文中多層級聯相位板結構的全光學衍射神經網絡(DNN)系統[5],我們的系統可以完成類似的全光學物體分類任務,同時具有非相干光照射下工作,低實驗復雜性,高可編程性等優點,更容易實現。 (3)單像素成像中圖像盲重建 單像素成像中一般既需要已知所有投影圖案,又需要已知所有單像素值,才能進行物體圖像的重建。這樣看起來二者缺一就無法重建圖像,其實未必。
假設投影圖案雖然是未知的,但它們保持固定不變。如果已知一定數量不同的物體圖像和它們對應單像素值序列作為訓練樣本,可以通過機器學習方式實現盲重建。筆者在研究[6]中并沒有使用“時尚潮流之選”的深度學習方法,而使用了更簡單的基于線性回歸模型的方式恢復未知的投影圖案,但獲得的結果在一定條件下優于深度學習的結果。 事實上,很多相干和非相干的光學成像系統都是線性的,一些傳統方法也可能對系統進行精確模擬,那么近年在各領域都普遍使用的深度學習方法是否一定優于傳統方法?一些仿真和實驗結果顯示,對于單像素成像系統和其他一些線性光學系統,深度學習其實未必總能表現出優勢,尤其在需要大量訓練樣本和泛化性這兩個方面表現出一定不足[6]。 (4)單像素成像中的可視加密 作為90后經典童年回憶的《冒險小虎隊》中,通過解密卡才能看到雜亂無章的條紋中隱藏的信息,這其實很類似于一種“可視加密”技術。
可視加密(Visual Cryptography)把要隱藏的圖像分解成幾個隨機圖案,把它們打印在透明膠片上,每個圖案稱為一個可視密鑰(Visual Key),無法從中看到隱藏的圖像。可是當可視密鑰重疊在一起時,隱藏圖像就可以在視覺上顯現出來。單像素成像中的探測器收集物體圖像總體光強度的方式,相當于進行了像素值的虛擬疊加操作,與可視加密一定程度上“異曲同工”。 筆者提出通過物體圖像和通過投影圖案兩種方式將可視加密在單像素成像中實現[7]。單像素的可視加密可以適用于打印在不透明介質上的可視密鑰圖案,并且容易在肉眼觀察不到的非可見光波段以及視平線之外隱藏角落實現可視加密,物理層面上提升可視加密的安全性。 例如,(a)和(b)兩個二維碼可以作為一組可視密鑰,用手機掃它們,可以讀出同樣的信息,不過讀出的并不是要隱藏的信息,而是做偽裝的“幌子”。通過單像素可視加密系統虛擬疊加到一起之后,依舊是一個可以用手機掃的二維碼(c),不過真正隱藏的信息”OK”浮現了出來。
此外單像素成像中,只對一組投影圖案的隨機置換也能實現圖像加密[8]。單像素成像的應用單像素成像可以把傳感器從一個單元陣列簡化為單個像素,與此同時,則需要額外的投影器件,比如,數字微鏡陣列DMD,并且要投影照射和記錄很多次,而不是一次性成像。 然而,這不妨礙在很多情況下,單像素相機仍然比普通相機更具有優勢,比如在可見光以外的一些波段,單元陣列傳感器難以制造,或者成本非常高,而只包含一個像素的簡單傳感器就容易實現得多,單像素成像為這些波段的低成本相機提供了一個好的選擇。 再比如普通相機拍攝照片時,物體需要放到鏡頭或者傳感器的視平線范圍內,而單像素探測器可以拍攝隱藏在拐角處的物體。當同時對多個光譜和多個偏振態的光場進行記錄時,難以在同一個單元陣列傳感器上對這么多的“頻道”同時進行復用,單像素探測器則比較容易在“頻道”間靈活來回切換。 目前,該技術已被研究者嘗試應用于多個領域,如遙感成像、顯微鏡、光譜儀、無人駕駛激光雷達、加油站氣體泄露監測、便攜式掃描儀等,單像素成像的潛在應用場景一直在不斷被發掘和擴展。
作者簡介
焦述銘,深圳大學納米光子學研究中心副研究員,香港城市大學博士畢業。主要從事單像素成像,全息成像及顯示,圖像處理等方面研究。以第一作者發表期刊論文20余篇,曾入選Hong Kong PhD Fellowship Scheme和廣東省“珠江人才計劃”博士后資助項目。
審核編輯:郭婷
-
傳感器
+關注
關注
2552文章
51382瀏覽量
755772 -
攝像頭
+關注
關注
60文章
4860瀏覽量
96107
原文標題:單像素成像圖像智能處理算法
文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論