電子發(fā)燒友網(wǎng)報道(文/周凱揚)對于高效的數(shù)據(jù)并行負載處理來說,矢量架構(gòu)的吸引力越來越大,主流ISA都開始注意到這一點。就拿我們熟悉的前超算王者——日本的富岳來說,其處理器富士通A64FX就是基于Arm可伸縮矢量擴展(SVE)的。Arm也在隨后推出的Armv9架構(gòu)中提出了改良版的SVE2,并在其中加入了對NEON的兼容,SVE2在HPC之外的市場應(yīng)用中做出了指令優(yōu)化,甚至可以用于手機、汽車等智能設(shè)備中。正是因為有了SVE的存在,富岳才得以單靠通用處理器完成高性能的大數(shù)據(jù)運算,而不是像其他主流超算一樣,還要靠堆積GPU、FPGA和AI加速器等片外加速器才能實現(xiàn)可觀的性能,我國的神威太湖之光同樣運用了這樣的矢量設(shè)計思路。但以上這些都是專有架構(gòu),微架構(gòu)不透明的同時也限制了開源和定制化方案的出現(xiàn),而這些均可以在RISC-V上一一實現(xiàn)。
RISC-V矢量處理器的吸引力
RISC-V的矢量擴展RVV自2015年提出以來,已經(jīng)有了長足的進展,也有了正式的1.0版本規(guī)范。與傳統(tǒng)的SIMD指令相比,RVV提供動態(tài)的矢量長度修改,做到了更高的效率、更小的代碼體積和更簡單的循環(huán)結(jié)束。我們近期已經(jīng)看到了不少RISC-V處理器被廣泛使用的新聞,比如谷歌選擇在其TPU上加入SiFive的X280處理器,其實看重的就是它在矢量處理上的優(yōu)勢。SiFive矢量處理器 / SiFive所以我們看到在SiFive的處理器產(chǎn)品中,像Performance P270和Intelligence X280都擁有優(yōu)秀的矢量處理能力,后者更是引入了一個512位矢量寄存器長度的架構(gòu),在完全支持矢量擴展標準的同時,還支持動態(tài)可變矢量長度的運算。SiFive也在其矢量擴展上做出了改進,稱其為SiFive智能擴展,與直接基于RV64GCV架構(gòu)的設(shè)計相比,X280的智能擴展在INT8格式下的矩陣乘法運算時可將執(zhí)行速度提高12倍。而且這不僅僅造福的是數(shù)據(jù)中心,還有受制于功耗卻又需要高吞吐量和單線程性能的邊緣應(yīng)用,比如AR/VR、數(shù)碼相機等等。SiFive同樣測試了可用于移動端或嵌入式設(shè)備的輕量級神經(jīng)網(wǎng)絡(luò)MobileNet,相較基于RISC-V標量的架構(gòu),SiFive智能擴展可以將速度提升144倍。同樣的還有晶心科技推出的RISC-V矢量處理器NX27V,該處理器采用了5級流水線的設(shè)計,晶心為其設(shè)計了強大的矢量處理單元,擁有32個矢量寄存器,最高支持512位的矢量長度,為了進一步支持AI應(yīng)用,晶心還為其增加了BF16和INT4的數(shù)據(jù)格式支持。據(jù)正在打造可擴展的高性能AI超算的初創(chuàng)公司Luminous Computing透露,他們打造的系統(tǒng)用到了數(shù)百個NX27V VPU核心,極大地提升了該系統(tǒng)的深度學(xué)習(xí)性能。
開源RISC-V矢量處理器
RISC-V作為開源架構(gòu)最棒的一點就在于,總是不缺香山處理器這樣優(yōu)秀的開源方案。比如2019年推出的Ara就是一款高效矢量協(xié)處理器,用于輔助OpenHW的CVA6 RISC-V應(yīng)用處理器Ara,只不過Ara剛發(fā)布之際還是基于早期的RVV規(guī)范設(shè)計的。來自蘇黎世聯(lián)邦理工學(xué)院(ETH)和華為蘇黎世研究中心的研究員們借助Ara的啟發(fā),基于RVV1.0發(fā)表了一個開源的高效RISC-V矢量處理器設(shè)計。他們基于格芯的22FDX工藝進行了吞吐量和PPA的驗證,整個系統(tǒng)運行頻率為1.34GH,在關(guān)鍵的矩陣乘法內(nèi)核下,F(xiàn)PU的利用率可以達到98%以上。相較之下,SiFive的X280和另一個開源矢量協(xié)處理器Vicuna宣稱的FPU利用率大于90%,伯克利的開源方案Hwacha可以做到95%以上。為了展示從RVV擴展這么多年以來的改進,他們也與基于RVV 0.5版下的設(shè)計做了對比,結(jié)果是在面積占用上有了15%的提升,吞吐量也有了6%的提升,雙精度計算效率也做到了37.1GFLOPS/W。結(jié)語
AI時代下,矢量處理的應(yīng)用場景已經(jīng)遠超我們的現(xiàn)象,包括深度學(xué)習(xí)、推薦系統(tǒng)、鍵值存儲和HPC等,都已經(jīng)廣泛利用了矢量計算。但如何做到高效高性能,才是未來所有ISA的努力方向,而RISC-V作為后來者,反而能在這上面找到彎道超車的機會。
聲明:本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請發(fā)郵箱huangjingjing@elecfans.com。
更多熱點文章閱讀
- 中國汽車出口暴增 已占俄羅斯三分之一市場
- 全球PC出貨量歷史性爆降,蘋果卻逆勢收割?寒氣傳到產(chǎn)業(yè)鏈上游
- 汽車電驅(qū)動系統(tǒng)技術(shù)未來發(fā)展趨勢及關(guān)鍵技術(shù)分析
- NASA新電池能量密度達500Wh/kg,固態(tài)電池將成主流?
- 俄羅斯芯片采購清單曝光,進口或?qū)⒗щy重重!
原文標題:通用計算仍有差距,RISC-V可靠矢量處理彎道超車
文章出處:【微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
處理器
+關(guān)注
關(guān)注
68文章
19312瀏覽量
230033 -
RISC-V
+關(guān)注
關(guān)注
45文章
2292瀏覽量
46198
原文標題:通用計算仍有差距,RISC-V可靠矢量處理彎道超車
文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
RISC-V架構(gòu)及MRS開發(fā)環(huán)境回顧
Sherwani的預(yù)測,5年后RISC-V指令的處理器就有可能進軍服務(wù)器市場。
③、RISC-V的應(yīng)用之三:存儲市場
硬盤本身并不需要像SSD那樣龐大的計算資源,但是由于新的磁記錄技
發(fā)表于 12-16 23:08
《RISC-V能否復(fù)制Linux 的成功?》
,創(chuàng)建實現(xiàn)自有加速器算法的自定義異構(gòu)集群。RISC-V作為一種ISA,我們一開始是在處理器內(nèi)核中采用吸引人的通用構(gòu)建塊,然后在此基礎(chǔ)上進行構(gòu)建,同時還利用最好的商業(yè)工具增強使用者的信心。所以,IP
發(fā)表于 11-26 20:20
什么是RISC-V?以及RISC-V和ARM、X86的區(qū)別
圖紙,處理器就是房子。
RISC和RISC-V的區(qū)別
RISC全稱Reduced Instruction Set Computer,即精簡指令計算
發(fā)表于 11-16 16:14
RISC-V,即將進入應(yīng)用的爆發(fā)期
計算機由控制整體的CPU(中央處理器)和加速器兩部分構(gòu)成。在AI計算中,功耗和效率是兩個關(guān)鍵因素。RISC-V架構(gòu)通過其簡潔的設(shè)計和定制化的擴展,可以實現(xiàn)高效的能量使用。該架構(gòu)能夠通過
發(fā)表于 10-31 16:06
risc-v在人工智能圖像處理應(yīng)用前景分析
的兼容性和可靠性,并為其在人工智能圖像處理領(lǐng)域的應(yīng)用提供更有力的保障。
綜上所述,RISC-V在人工智能圖像處理領(lǐng)域具有廣闊的應(yīng)用前景。其開源性、靈活性、低功耗和高性能等特點使得它成為
發(fā)表于 09-28 11:00
RISC-V Summit China 2024 | 青稞RISC-V+接口PHY,賦能RISC-V高效落地
獲三份益
青稞RISC-V,更懂下游客戶的MCU內(nèi)核
通用RISC-V架構(gòu)進入MCU行業(yè)難免水土不服。沁恒通過“架構(gòu)級”創(chuàng)新,解決下游開發(fā)/應(yīng)用過程中的痛點問題,讓青稞RISC-V更接
發(fā)表于 08-30 17:37
risc-v的發(fā)展歷史
了基于RISC-V指令集的服務(wù)器處理器,安謀科技也推出了RISC-V MCU等產(chǎn)品。
學(xué)術(shù)界與開源社區(qū):RISC-V架構(gòu)在學(xué)術(shù)界和開源社區(qū)中也得到了廣泛的研究和應(yīng)用。許多研究機構(gòu)和開發(fā)
發(fā)表于 07-29 17:20
rIsc-v的缺的是什么?
RISC-V作為一種開源的指令集架構(gòu)(ISA),自其誕生以來就受到廣泛關(guān)注和應(yīng)用,但它也存在一些不足之處。以下是RISC-V架構(gòu)目前存在的主要缺點:
1. 性能問題
相對于專用ISA的性能差距:盡管
發(fā)表于 07-29 17:18
RISC-V適合什么樣的應(yīng)用場景
設(shè)計使得開發(fā)者可以靈活選擇所需的指令集和模塊,以滿足嵌入式系統(tǒng)的各種性能要求。
3. 人工智能(AI)和機器學(xué)習(xí)(ML)
高性能計算:RISC-V結(jié)合AI加速器或協(xié)處理器,可以提供高效的人工智能
發(fā)表于 07-29 17:16
為什么要有RISC-V
RISC-V(“RISC five”)的目標是成為一個通用的指令集架構(gòu)(ISA):①、它要能適應(yīng)包括從最袖珍的嵌入式控制器,到最快的高性能計算機等各種規(guī)模的
發(fā)表于 07-27 15:05
淺析RISC-V領(lǐng)先ARM的優(yōu)勢
RISC-V的開源特性和定制化能力使其在某些特定領(lǐng)域具有更強的競爭力。
綜上所述,RISC-V相對于ARM的優(yōu)勢主要體現(xiàn)在開源與免費、定制化能力強、生態(tài)系統(tǒng)的快速發(fā)展、安全性與可靠性以及應(yīng)用領(lǐng)域廣泛等方面。這些優(yōu)勢使得
發(fā)表于 06-27 08:45
Ubuntu現(xiàn)已適配RISC-V單板計算機Milk-V Mars
科技高性能RISC-V多媒體處理器昉·驚鴻-7110(JH-7110)。RISC-V單板計算機Milk-VMarsMilk-VMars是全球首款信用卡大小的四核高性
國產(chǎn)RISC-V MCU推薦
,CH583搭載32位青稞RISC-V處理器WCH RISC-V4A,低功耗兩級流水線,高性能,擁有多檔系統(tǒng)主頻,最低32KHz ,擁有特有高速的中斷響應(yīng)機制。
單片搞定Wi-Fi和藍牙
許多網(wǎng)友也
發(fā)表于 04-17 11:00
什么是RISC-V?RISC-V的關(guān)鍵技術(shù)
RISC-V不僅僅是一個流行語;它建立在堅實的技術(shù)基礎(chǔ)之上,使其有別于其他指令集架構(gòu) (ISA)。RISC-V的核心是基于精簡指令集計算(RISC)原則,強調(diào)效率和性能。
發(fā)表于 03-26 09:34
?3564次閱讀
RISC-V 基礎(chǔ)學(xué)習(xí):RISC-V 基礎(chǔ)介紹
計算機指令設(shè)計架構(gòu)后。我們來看看 RISC-V。
RISC-V 的 “V”, 有兩層意思,一方面代表第5代 RISC;另一方面, “
發(fā)表于 03-12 10:25
評論