從理論上講,異構多核設備可以配備一個計算塊,該計算塊針對給定用例的任何類型的操作進行了優化。用于視頻處理的 GPU、用于對象識別的神經網絡處理器、運行操作系統的 CPU 等等。與同級別的同質處理器相比,不同用途的內核為 SoC 提供了更大的靈活性,因此在更廣泛的工作負載范圍內具有更高的性能和更低的功耗。
但當您開始考慮基于邊緣的 AI、計算機視覺等應用程序的要求時,事實是 I/O 和內存變得與原始處理性能一樣受到限制,甚至更多。
“內存速度只會這么快,對吧?” 英偉達嵌入式與邊緣計算副總裁兼總經理 Deepu Talla “它并沒有呈指數級增長。由于大小,位寬大致相同:它可以是 16 位、32 位、64 位、128 位,等等。大多數嵌入式處理器通常具有 32 位甚至 16 位接口,這也是出于成本和尺寸的原因。
“內存的速度只是一代比一代增長 2 倍,而且這通常每三年發生一次,”他繼續說道。“然而,SoC 中的計算需求可能增加了 10 倍或 20 倍。”
您如何協調計算性能的這種不成比例的增長與內存技術的相對較小的進步?特別是當處理器演變成獨特的邏輯集合時,它們都需要自己訪問內存等資源。
根據塔拉的說法,你把它給了他們。以下是嵌入式存儲器架構為滿足下一代異構多核處理器的需求而發展的三種方式。
1、內核專用 SRAM
“如果你看很多這些嵌入式處理器,它們過去一直都有 SRAM,”Talla 說。“現在,對于每個特定單元,我們都有本地 SRAM,它從 DRAM 獲取數據,在本地存儲并處理它,然后發回最終輸出。”
特定于內核的 SRAM 提供了幾個優勢,首先是由于不必將臨時數據寫回片外 DRAM 所帶來的內存性能提升。
這種架構還具有降低功耗的額外好處,因為超低電壓 SRAM 模塊位于 SoC 內相應的邏輯 IP 附近或附近。
“如果你使用 DRAM,這可能是一個數量級的功率,所以你實際上是通過使用這些技術來節省功率,”Talla 解釋道。
2、增加系統內存
今天的嵌入式處理器具有高達 4 MB 到 8 MB 的系統內存。此系統內存并非專用于任何特定內核,并且可以在 CPU、GPU 和加速器等元素之間共享。
與專用 SRAM 類似,更多共享系統內存的主要好處是更少的 DRAM 訪問。例如,傳統的視頻編碼序列如下所示:
DRAM -》 視頻編碼器 -》 DRAM -》 附加計算 -》 DRAM
增加的系統緩存可以實現這一點:
DRAM -》 視頻編碼器 -》 系統內存 -》 附加計算 -》 DRAM
如前所述,不同之處在于單獨的內核不必不斷地從片外 DRAM 中獲取數據,因為大系統內存消除了對中間步驟的需要。
3、增加緩存大小
最后,隨著更新的工藝技術使更高容量的內存更便宜,緩存大小將不可避免地增加。在異構 SoC 上發現的用于 CPU、GPU、DSP 和其他核心架構的更大緩存也將減少 DRAM 流量。
并且將增加的緩存大小與前兩個進步配對開始產生一些重大收益。
“更多的 SRAM、通用的系統內存以及更多的大容量緩存可以讓您在接下來的三到五年內將性能提高 10 倍到 100 倍,即使內存帶寬可能只增加了一倍或四倍,”Talla 指出出去。
審核編輯:郭婷
-
嵌入式
+關注
關注
5087文章
19148瀏覽量
306186 -
DRAM
+關注
關注
40文章
2320瀏覽量
183637 -
編碼器
+關注
關注
45文章
3651瀏覽量
134775
發布評論請先 登錄
相關推薦
評論