深度學習是一種關鍵的計算方法,它正在推動技術的發展——處理海量數據并發現人類永遠無法自行辨別的微妙模式。但為了獲得最佳性能,深度學習算法需要得到正確的軟件編譯器和硬件組合的支持。特別是,允許根據需要靈活使用硬件資源進行計算的可重構處理器是關鍵。
在最近的一項研究中,香港的研究人員報告了一種名為 ReAAP 的新型可重構處理器,其性能優于幾種常用于支持深度神經網絡 (DNN) 的計算平臺,深度學習是一種有用的形式,通常涉及具有許多計算密集型的大型數據集數據層。他們在 10 月 10 日發表在IEEE Transactions on Computers上的一篇論文中對其進行了描述。
在他們的研究中,研究人員將他們在 ReAAP 中提出的軟件編譯器與 Nvidia GPU 和 ARM CPU 上的其他三個基線軟件編譯器進行了比較。結果表明,它的執行速度是運行在GPU并且是運行相同軟件編譯器的 1.6 到 3.3 倍在中央處理器上.
此外,Zheng 指出,ReAAP 為各種不同的計算密集層實現了硬件資源的持續高利用率。
雖然 ReAAP 擅長處理具有典型數據密集型工作負載的 DNN,但它目前不太適合在數據稀疏時支持 DNN。鄭說他的團隊希望在未來解決這個問題。更重要的是,研究人員希望以 ReAAP 為基礎,使其能夠更好地處理量化數據(處理的數據以一種顯著降低神經網絡的內存需求和計算成本的方式)。
“在 [ReAAP 更好地處理量化數據] 的擴展完成和評估后,我們將考慮將其與其他幾個人工智能計算加速解決方案一起商業化,”鄭說,并指出這將使 ReAAP 在資源方面更有效率受限平臺,例如各種物聯網 (IoT) 設備。
而普通處理器通常允許數據使用特定的硬件路徑進行處理,可重構處理器提供了一種更具適應性的選擇:重新配置最有效的硬件資源以根據需要處理數據。
“可重構處理器結合了軟件靈活性和硬件并行性的優勢,”參與該研究的香港科技大學電子與計算機工程系博士后研究員鄭建偉解釋道。
這些優勢促使他的團隊創建了 ReAAP,這是一個集成的軟硬件系統。它的軟件編譯器負責評估和優化各種深度學習工作負載。一旦確定了并行處理數據的最佳解決方案,它就會發送指令重新配置硬件協處理器,從而分配適當的硬件資源來進行并行計算。“作為端到端系統,ReAAP 可以部署以加速各種深度學習應用程序,只需在 [the] 軟件中為每個應用程序定制一個 Python 腳本,”Zheng 解釋說。
審核編輯 :李倩
-
處理器
+關注
關注
68文章
19342瀏覽量
230228 -
AI
+關注
關注
87文章
31097瀏覽量
269434 -
數據集
+關注
關注
4文章
1208瀏覽量
24737
原文標題:一種讓AI更快的可重構處理器
文章出處:【微信號:芯長征科技,微信公眾號:芯長征科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論