喬治華盛頓大學的研究人員報告了一種構建光子張量核心的方法,該方法利用相變光子存儲器來實現神經網絡(NN)。他們的新穎架構已于上周在《 AIP應用物理評論》(AIP Applied Physics Review)上在線報道,與傳統的GPU和其他張量核心設備相比,有望實現性能提升和功耗優勢。雖然已經探索了幾種光子神經網絡設計,但用于執行張量操作的光子張量核心尚未實現。
光子學[i]涵蓋了廣泛的光技術,涵蓋了通過混合光電技術跨越光纖的各種技術。例如,光學互連技術是提高內存到處理器乃至處理器到處理器帶寬的重要研究領域。高帶寬和低功耗是光子學的吸引力。
在他們的 論文中, 用于機器學習的光子張量核心,Mario Miscuglio和Volker Sorger認為,在異構計算時代,基于光子的專用處理器具有增強電子系統的巨大潛力,并且可能在網絡邊緣設備以及其他設備中表現出色5G通信。例如,用于推理的預訓練光子張量核心神經網絡將消耗很少的功率。
Miscuglio告訴 HPCwire:“除了可以直接在光域中工作而增加的速度和帶寬之外,還可以利用光纖中傳輸的信號的固有光學特性,使用光子架構的優勢是執行推理的功耗更低這對于智能光學低功耗傳感器很有用。”
廣義上講,神經網絡大量使用矩陣向量乘法。毫不奇怪,在這種計算方式下,最新的GPU和TPU比CPU更好。研究人員在論文中很好地總結了挑戰:
“對于提供高計算靈活性的通用處理器,這些矩陣運算是串行(即一次一次)進行的,同時需要連續訪問高速緩存,因此產生了所謂的”馮·諾依曼瓶頸”。已經設計出了用于神經網絡的專用架構,例如圖形處理單元(GPU)和張量處理單元(TPU),以減少馮·諾依曼瓶頸的影響,從而實現尖端的機器學習模型。這些架構的范例是提供域特定性,例如對卷積進行優化或與CPU不同的是執行并行運算的矩陣向量乘法(MVM),從而并行部署 脈動算法。
“ GPU具有針對矩陣數學運算而優化的數千個處理核心,可提供數十至數百個TFLOPS(層級浮點運算)的性能,這使GPU成為基于深度NN的AI和ML應用程序的顯而易見的計算平臺。GPU和TPU相對于CPU尤其有利,但是當用于對大型二維數據集(例如圖像)實施深度NN執行推理時,它們非常耗電,并且需要更長的計算時間(》幾十毫秒)。此外,用于不太復雜的推理任務的較小矩陣乘法[例如,美國國家標準與技術研究院數據庫(MNIST)的手寫數字的分類]仍然受到不可忽略的延遲的挑戰,
他們提出了一種在光子學中實現的張量核心單元,它依賴于光子復用(WDM,波分復用)??信號,“經過濾波后,使用基于在 波導上構圖的Ge 2 Sb 2 Se 5導線的工程化多態光子存儲器進行加權后加權。通過使用鎢電極引起的焦耳熱的電熱切換,通過有選擇地改變導線的相(非晶/晶體)來對光子存儲器進行重新編程。如果需要,可以并行(幾微秒)實現光子存儲器編程,或者,該光子張量核心可以作為具有預設置內核矩陣的無源系統來運行?!?/p>
Miscuglio說,相變存儲技術是一項至關重要的進步,“我們大腦中的每個神經元同時存儲和處理數據。同樣,在我們的體系結構中,我們使用的存儲單元可以通過電子方式寫入,并且可以存儲多位權重,并且可以通過簡單地讓光線與材料相互作用來光學讀取。我們的光子存儲器依賴寬帶透明相變材料,與其他基于更成熟的GST(鍺-銻-碲)的實現方式不同,其特點是在電信波長下的非晶態損耗可忽略不計。”
“這很重要,因為它支持更深的架構,無需使用額外的激光源或放大器就可以解決更復雜的任務。我們還提出了一種多狀態光子存儲器(4位)架構,該架構可以使用電熱加熱器輕松擦除并寫在芯片上。與依賴于片上或片外的繁瑣的光學寫入/擦除的其他實現方式不同,所有存儲器均具有專用電路并可以并行寫入。
Miscuglio說,該體系結構未映射特定的網絡體系結構,而是神經網絡的更通用的加速器。利用其模塊化架構,可以“直接將光子TPU用于一系列操作,包括但不限于矩陣矩陣乘法,例如矢量矩陣乘法,卷積。這些代數運算是許多復雜的科學和社會問題的關鍵運算?!?/p>
“我們認為,從長期來看,數據中心將從這種架構中受益匪淺,因為它們處理的許多信息已經在光域中。我們認為它不會取代超級計算機,但可用作預處理單元,可與超級計算機協同工作,處理靠近網絡邊緣的數據,從而對信號進行分類和關聯,以尋找特定的數據或模式塊,從而減少數據流量?!?/p>
在撰寫本文時,他們已經測試了多態低損耗光子存儲設備,“顯示出的性能與仿真非常吻合”。Miscuglio說:“我們開發了執行4×4矩陣乘法的單光子核心架構,目前正在開發第一代光子張量核心。關于時間表,我們計劃在六個月至一年內對單核進行實驗演示,并在未來幾年內對功能齊全的多核張量處理器進行演示?!?/p>
-
處理器
+關注
關注
68文章
19261瀏覽量
229662 -
存儲器
+關注
關注
38文章
7484瀏覽量
163768 -
神經網絡
+關注
關注
42文章
4771瀏覽量
100720
發布評論請先 登錄
相關推薦
評論