西班牙的SemiDynamics基于其完全可定制的64位內核開發了用于AI芯片設計的RISC-V Tensor Unit。
RISC-V Tensor 單元集成到緩存子系統中,SemiDynamics 使其成為第一個用于數據中心高性能 AI 芯片設計的完全一致的此類單元。
LLaMa-2 或 ChatGPT 等大型語言機器學習模型 (LLM) 使用數十億個參數,需要大量計算能力。LLM 層中的大部分計算可以作為張量單元硬件中的矩陣乘法有效實現。
張量單元構建在 Semidynamics RVV1.0 矢量處理單元之上,并使用現有的矢量寄存器來存儲矩陣。這使得張量單元可以用于需要矩陣乘法功能的層,例如全連接和卷積,并將向量單元用于激活函數層(ReLU、Sigmoid、Softmax 等),這是一個很大的改進- 單獨的 NPU 可能會與激活層作斗爭。
張量單元使用矢量單元功能以及 Atrevido-423 Gazzillion CPU 從內存中獲取所需的數據。64 位 CPU 內核的性能意味著不需要直接內存訪問 (DMA) 來管理數據流。由于張量單元使用向量寄存器來存儲其數據,并且不包含新的、架構上可見的狀態,因此它可以與任何支持 RISC-V 向量的 Linux 一起使用,而無需進行任何更改。
SemiDynamics 創始人兼首席執行官 Roger Espasa 表示:“這個新的 Tensor Unit 旨在與我們的其他創新技術完全集成,以提供具有出色 AI 性能的解決方案?!?/p>
“首先,核心是我們的 64 位完全可定制的 RISC-V 內核。然后是我們的矢量單元,它通過我們的 Gazzillion 技術不斷饋送數據,因此不會丟失任何數據。然后是張量單元,它執行人工智能所需的矩陣乘法。該解決方案的每個階段都經過精心設計,可與其他階段完全集成,以實現最佳的人工智能性能和非常簡單的編程。與僅在標量核心上運行 AI 軟件相比,性能提高了 128 倍?!?/p>
Tensor Unit 將于下個月在美國舉行的 RISC-V 峰會上進行討論,作為人工智能芯片設計重點的一部分。
審核編輯:黃飛
-
寄存器
+關注
關注
31文章
5355瀏覽量
120546 -
cpu
+關注
關注
68文章
10873瀏覽量
212052 -
機器學習
+關注
關注
66文章
8422瀏覽量
132741 -
RISC-V
+關注
關注
45文章
2292瀏覽量
46210 -
AI芯片
+關注
關注
17文章
1889瀏覽量
35074
原文標題:RISC-V,進攻AI芯片
文章出處:【微信號:芯長征科技,微信公眾號:芯長征科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論