使用超表面的幾何圖像變換示意圖
在一個寒冷晴朗的日子里,你開車行駛在鄉村公路上,周圍是被雪覆蓋的田野。在一瞬間,你的眼睛會處理場景,挑選出單獨的物體來聚焦——一個停車標志,一個谷倉——而場景的其余部分則在外圍模糊。當你坐在辦公桌前時,你的大腦將聚焦和模糊的圖像存儲為記憶,稍后可以在腦海中描繪出來。
賓夕法尼亞州立大學電氣工程研究人員模仿人眼的這種簡單、即時的圖像處理能力,創造了一種超表面:一種類似于載玻片的光學元件,使用放置在不同角度的微小納米結構來控制光。在通訊作者、賓夕法尼亞州立大學電氣工程與計算機科學Xingjie Ni副教授的帶領下,該團隊在《自然·通訊》上發表了他們的研究成果。
研究人員表示,人工智能系統需要大量的計算能力和能量,處理圖像和識別物體的速度可能很慢。相比之下,超表面可以用于在圖像被相機捕捉之前對其進行預處理和變換,從而使計算機和人工智能能夠以最小的功率和數據帶寬對其進行處理。
超表面的工作原理是將圖像從笛卡爾坐標系轉換為對數極坐標系,笛卡爾坐標系中圖像像素沿x和y軸排列成直線行和直線列,對數極坐標系統使用類似牛眼的像素分布。
Xingjie Ni說:“就像人眼內部光受體的排列一樣,超表面拍攝圖像并將其排列在對數極坐標系中——中心區域的像素密度更高,聚焦區域的像素更稀疏。這使得照片中更重要的部分能夠清晰地顯示出來,而其他部分則不那么聚焦,從而節省了數據帶寬。”
超表面被放置在相機前面,這樣光線首先穿過它,并將圖像從笛卡爾坐標系轉換為對數極坐標,然后由相機數字化并傳輸到計算機。由于它使用彎曲光的納米結構工作,因此超表面不需要任何功率,以光速工作。
Xingjie Ni說:“由于物體的圖像可能在大小或方向上有所不同,因此需要對圖像進行預處理,使其能夠抵抗縮放和旋轉的變化。這種預處理有助于人工智能應用程序更容易地將它們識別為同一對象。”
通過在相機前放置不同的超表面,研究人員還可以將對數極坐標圖像轉換回笛卡爾坐標的原始圖像。
研究人員表示,這項發明有許多潛在的應用,包括用于目標跟蹤和監視,例如繪制汽車如何在城市中行駛的地圖。
Xingjie Ni說:“超表面可以與人工智能系統協同使用作為預處理器,從而更容易從多個街景攝像頭中識別同一輛車。或者,如果將其應用于衛星,它可能會跟蹤飛機從起飛到降落的過程。”
審核編輯 黃宇
-
圖像處理
+關注
關注
27文章
1292瀏覽量
56762 -
人工智能
+關注
關注
1791文章
47314瀏覽量
238626
發布評論請先 登錄
相關推薦
評論