本文由半導體產業縱橫(ID:ICVIEWS)編譯自quantamagazine
光學神經網絡使用光子而不是電子,比傳統系統具有優勢。摩爾定律已經相當快了。它認為,計算機芯片每兩年左右就會安裝兩倍數量的晶體管,從而在速度和效率上產生重大飛躍。但深度學習時代的計算需求增長速度甚至更快——這種速度可能不可持續。國際能源署預測,2026年人工智能消耗的電力將是2023年的10倍。計算硬件公司Lightmatter的創始人兼首席執行官尼克·哈里斯 (Nick Harris)表示,人工智能所需的算力每3個月就會翻一番,速度遠遠快于摩爾定律的預測。最有前途的方法之一是不使用可靠的電子來處理信息,而是使用光子流。最近的結果表明,對于現代人工智能的某些基礎計算任務,基于光的“光學計算機”可能具有優勢。劍橋大學物理學家納塔利婭·貝爾洛夫表示,光計算的發展“為人工智能等需要高速、高效處理的領域的突破鋪平了道路” 。
理論上,光提供了誘人的潛在好處。其一,光信號比電信號可以攜帶更多信息——它們有更多的帶寬。光頻率也比電頻率高得多,因此光系統可以在更短的時間內以更少的延遲運行更多的計算步驟。然后是效率問題。除了相對浪費的電子芯片造成的環境和經濟成本之外,它們的運行溫度也非常高,以至于只有一小部分晶體管(所有計算機核心的微小開關)可以隨時處于活動狀態。理論上,光學計算機可以同時進行更多操作,在消耗更少能源的同時處理更多數據。斯坦福大學電氣工程師戈登·韋茨斯坦(Gordon Wetzstein ) 表示,“如果我們能夠利用”這些優勢,“這將帶來許多新的可能性。”看到潛在的優勢,研究人員長期以來一直嘗試將光用于人工智能這個計算需求量很大的領域。例如,在 20 世紀 80 年代和 90 年代,研究人員使用光學系統構建了一些最早的神經網絡。Demetri Psaltis 和加州理工學院的兩名同事使用這些早期光學神經網絡 (ONN) 之一創建了一個巧妙的面部識別系統。他們將一個受試者(實際上是研究人員之一)的圖像作為全息圖存儲在光折變晶體中。研究人員使用全息圖來訓練 ONN,然后 ONN 可以識別研究人員的新圖像并將他與同事區分開來。但光也有缺點,光子通常不會相互作用,因此一個輸入信號很難控制另一個信號,而這正是普通晶體管的優勢。現在,它們已被放置在數十億枚硬幣大小的芯片上,這是數十年漸進式改進的產物。
近年來,研究人員發現了光學計算的殺手級應用:矩陣乘法。
一些簡單的數學
矩陣或數字數組相乘的過程是大量重型計算的基礎。具體來說,在神經網絡中,矩陣乘法是如何在舊數據上訓練網絡以及如何在經過訓練的網絡中處理新數據的基本步驟。光可能是比電更好的矩陣乘法媒介。
這種人工智能計算方法在 2017 年爆發,當時麻省理工學院的 Dirk Englund 和 Marin Solja?i? 領導的團隊描述了如何在硅芯片上構建光學神經網絡。研究人員將他們想要相乘的各種量編碼成光束,然后將光束發送通過一系列改變光束相位(光波振蕩方式)的組件,每個相位改變代表一個乘法步驟。通過反復分裂光束、改變相位、重新組合,可以使光有效地進行矩陣乘法。在芯片的末端,研究人員放置了光電探測器來測量光束并揭示結果。研究人員教他們的實驗設備識別口語元音,這是神經網絡的常見基準任務。憑借光的優勢,它可以比電子設備更快、更有效地完成這一任務。其他研究人員已經知道光有利于矩陣乘法;2017 年的論文展示了如何將其付諸實踐。
康奈爾大學光子學專家Peter McMahon表示,這項研究“激起了人們對 ONN 的巨大興趣,那個人影響力非常大。”
聰明的想法
自 2017 年發表論文以來,隨著各種研究人員提出了新型光學計算機,該領域取得了穩步進展。Englund 和幾位合作者最近推出了一種名為 HITOP 的新型光網絡,該網絡結合了多項先進技術。最重要的是,它的目標是隨著時間、空間和波長的增加計算吞吐量。前麻省理工學院博士后、現任職于南加州大學的Zaijun Chen表示,這有助于 HITOP 克服光學神經網絡的缺點之一:將數據從電子元件傳輸到光學元件需要大量能量,反之亦然。但Zaijun Chen說,通過將信息打包到光的三個維度中,它可以更快地通過 ONN 推送更多數據,并將能源成本分散到許多計算中。這降低了每次計算的成本。研究人員報告說,HITOP 可以運行比以前基于芯片的 ONN 大 25,000 倍的機器學習模型。
需要明確的是,該系統仍遠不能與其電子前輩相媲美。Chen表示,HITOP 每秒執行約 1 萬億次運算,而先進的 Nvidia 芯片可以處理 300 倍的數據,他希望擴大該技術的規模,使其更具競爭力。但光學芯片的效率卻非常引人注目。“這里的游戲是我們將能源成本降低了 1,000 倍,”Chen說。其他小組已經創建了具有不同優勢的光學計算機。去年,賓夕法尼亞大學的一個團隊描述了一種新型 ONN,它提供了不同尋常的靈活性。這種基于芯片的系統將激光照射到構成電子芯片的半導體部分上,從而改變半導體的光學特性。激光有效地映射了光信號的路徑,從而完成了它執行的計算。這使得研究人員可以輕松地重新配置系統的功能。這與大多數其他基于芯片的系統(光學和電子系統)有著明顯的區別,在這些系統中,路線是在制造工廠中仔細制定的,并且很難改變。該研究的主要作者吳天偉說:“我們所擁有的東西非常簡單。我們可以重新編程,動態改變激光圖案。”研究人員利用該系統設計了一個成功區分元音的神經網絡。大多數光子系統在構建之前都需要進行訓練,因為訓練必然涉及重新配置連接。但由于該系統很容易重新配置,研究人員在將模型安裝到半導體上后對其進行了訓練。他們現在計劃增加芯片的尺寸,并用不同顏色的光編碼更多信息,這應該會增加它可以處理的數據量。
即使是在 90 年代創建面部識別系統的 Psaltis 也對這一進步感到印象深刻。“與實際發生的事情相比,我們 40 年前最瘋狂的夢想顯得非常渺小。”
第一縷曙光
雖然光學計算在過去幾年中發展迅速,但它還遠未取代實驗室外運行神經網絡的電子芯片。論文宣布光子系統比電子系統效果更好,但它們通常使用舊的網絡設計和較小的工作負載來運行小型模型。安大略省皇后大學的 Bhavin Shastri 表示,許多關于光子霸權的報道數據并沒有說明全部情況。“很難與電子產品進行同類比較,”他說:“例如,當他們使用激光時,他們并沒有真正談論為激光供電的能量。”
實驗室系統需要擴大規模才能顯示出競爭優勢。Bhavin Shastri 問道:“要把它做大到什么程度才能獲勝?”答案是:非常大。這就是為什么沒有人能與英偉達制造的芯片相媲美,英偉達的芯片為當今許多最先進的人工智能系統提供動力。在此過程中,需要解決大量的工程難題——電子方面已經解決了幾十年的問題。麥克馬洪說:“電子領域從一開始就具有巨大的優勢。”一些研究人員認為,基于 ONN 的人工智能系統將首先在提供獨特優勢的專業應用中取得成功。Shastri 表示,一種有前途的用途是抵消不同無線傳輸之間的干擾,例如 5G 蜂窩塔和幫助飛機導航的雷達高度計。今年年初,Shastri 和幾位同事創建了一個 ONN,可以整理不同的傳輸并實時挑選出感興趣的信號,處理延遲低于 15 皮秒(15 萬億分之一秒)——不到千分之一電子系統所花費的時間,同時使用不到 1/70 的功率。
但Bhavin Shastri 表示,宏偉的愿景——一種可以超越通用電子系統的光學神經網絡——仍然值得追求。去年,他的團隊進行的模擬顯示,十年內,足夠大的光學系統可以使某些人工智能模型的效率比未來電子系統的效率提高 1000 倍以上。“現在很多公司都在努力爭取1.5倍的收益。一千倍的好處,那就太神奇了。”他說:“如果成功的話,這可能是一個為期 10 年的項目。”
-
人工智能
+關注
關注
1791文章
47344瀏覽量
238728 -
光芯片
+關注
關注
3文章
95瀏覽量
10907 -
計算機芯片
+關注
關注
0文章
42瀏覽量
3512
發布評論請先 登錄
相關推薦
評論