電子發燒友網報道(文/周凱揚)近年來,RISC-V已經成了業界不可忽視的成功ISA之一,出貨核心數超過百億顆,但這百億核心中大部分用在了低功耗IoT等應用上。隨著高性能計算已經進入Exascale時代,后發的RISC-V是否有機會在HPC市場占據一席之地,是不少廠商和開發者都在琢磨的問題。
其實從去年開始,RISC-V就已經在往這個方向發力了,各種高性能RISC-V處理器的橫空出世,終結了RISC-V只能做中低端的論點。RISC-V國際基金會也在去年將HPC標記為RISC-V發展的戰略優先領域之一。倪光南院士在上周舉辦的玄鐵RISC-V生態大會上,也強調了發展基于RISC-V架構的DSA新型服務器是中國的一大機遇。既然如此,市面上已有的高性能RISC-V處理器究竟表現如何,又是否已經建立起相關的生態呢?
SiFive
作為RISC-V IP生態的中堅力量之一,SiFive已經推出了一系列RISC-V IP產品,包括主打高性能的Performance系列、主打AI算力的Intelligence、面向汽車市場的Automotive系列和面向低功耗IoT應用的Essential。
P670作為SiFive Performance系列的主打產品,采用了四發射13級流水線的設計,相較上一代P550,有了50%以上的性能提升。即便是相比Arm的Cortex-A78,依然有著明顯的PPA優勢。P670的SpecINT2K6/GHz跑分在12以上,已經可以滿足部分商用服務器的性能要求。
以算能的SG2380為例,這是一款2.5GHz 16核 RISC-V處理器,也是計劃于今年出貨的高性能大模型加速器。算能宣稱這是RISC-V在LLM應用架構設計上的全新嘗試,旨在為移動終端提供最強的大模型性能,支持Llama、StableDiffusion等語言、視覺類大模型支持。SG2380采用了RISC-V CPU+TPU的設計,而CPU部分正是基于SiFive P670打造,TPU則是基于SiFive的X280打造。
為了追求更高的性能,為數據中心提供更高的通用算力支持,SiFive于去年發布Performance的下一代旗艦產品P870。P870采用了6-wide、4發射、最多配置16核的設計,SpecINT2K6/GHz跑分高達18以上。SiFive表示P870非常適合用于消費級應用,或是搭配Vector處理器用于數據中心。
為支持下一代高性能應用,SiFive也已經圍繞其RISC-V打造了一系列解決方案,比如Hypervision拓展和系統級的虛擬化IP,WorldGuard系統安全保護等,都能進一步加快RISC-V在HPC和數據中心等應用上的部署。
除此之外,SiFive也已經在規劃下一代高性能核心,Napa。不過SiFive目前尚未透露更多關于Napa的情報,可以預想Napa會支持更多的核心數量,采用更先進的工藝,并提供更高的性能。
平頭哥
平頭哥的C910在2020年面世之際可謂是當時為數不多的RISC-V處理器中,性能最靠前的產品。這個在當時就采用了12級流水線設計的處理器,在臺積電12nm的工藝支持下,跑分達到了6 DIMPS/MHz和7 Coremark/MHz,已經可以超越Arm Cortex-A73,更是超越了當時市面上其他亂序RISC-V處理器。
今年,法國云服務廠商Scaleway推出了基于平頭哥曳影1520 SoC打造的云服務器實例,這也是首個登錄公開商用云服務平臺的RISC-V產品,而曳影1520 SoC的CPU部分正是基于四核玄鐵C910的設計。除了云實例之外,全球首款RISC-V筆記本電腦ROMA,也是基于曳影1520 SoC打造,足以說明C910在通用計算性能上的優秀。
去年11月,平頭哥進一步發布了C920這個加強AI計算的9系列玄鐵處理器,維持了12級流水線的設計,但增加了可選配的亂序Vector運算單元,支持最新的Vector 1.0擴展。得益于新的運算單元,C920主要應用于有高并發算力需求的人工智能、自動駕駛和網絡通信等領域。
算能科技也基于玄鐵C920打造了SG2042,作為全球首個商用量產的64核RISC-V CPU,SG2042還支持雙路CPU互聯,典型功耗卻只有120W。且在PLCT的支持下,SG2042目前已經適配了Ubuntu、Arch Linux、openEuler、Deepin等多款操作系統,Firefox 和 LibreOffice 等常用辦公軟件也能成功運行。
今年的玄鐵RISC-V生態大會上,達摩院院長張建鋒透露C930也將在年內發布,玄鐵C930兼容RVA24 Profile,SpecINT2006最高跑分可達15/GHz,令人期待未來會有哪些產品基于玄鐵C930打造,以及阿里云是否會開始基于RISC-V硬件提供云實例。
Tenstorrent
Tenstorrent作為業界炙手可熱的初創企業之一,已然成為絕大多數RISC-V會議的常客了,基于同一設計,Tenstorrent于短短一年的時間內,發布了五款RISC-V亂序處理器IP,其中Alastor和Ascalon是他們的高性能RISC-V處理器產品,前者針對客戶和邊緣端市場,后者針對服務器、筆記本和HPC市場。
Tenstorrent的RISC-V處理器IP的高性能設計,主要體現在指令集解碼器的寬度。要知道目前的主流x86處理器架構設計,一般不會超過six-wide,比如AMD的Zen 4為4-wide,而英特爾的Golden Cove為6-wide,上面提到的P870也只是6-wide。
而Alastor采用了6-wide指令集解碼器寬度的設計,Ascalon更是做到了6-wide指令集解碼器寬度。這自然也離不開Tenstorrent的“蘋果背景”,畢竟無論是現任CEO,被譽為硅仙人的Jim Keller,還是Tenstorrent的首席CPU架構師Wei-Han Lien,都是蘋果寬CPU微架構背后的功臣,蘋果M1、A14等芯片的CPU均采用了8-wide的設計。
Ascalon集成了六個ALU、兩個FPU和兩個Vector單元,規格相當高,所以主要用于高端服務器、數據中心、科學計算、大規模虛擬化以及實時數據分析之類的商業高性能計算應用。從去年Tenstorrent給出的SpecINT2017/GHz成績來看(Alastor 1.9,Ascalon 2.2),Ascalon 跑分甚至超過了市面上所有主流服務器CPU核心,僅次于預測的AMD Zen 5跑分。
除了高性能計算通用核心外,Tensorrent打造了專用于神經網絡推理和訓練的專用核心,Tensix。Tensix支持主流數據精度,比如BF4、BF8、INT8、FP16甚至是FP64。相較只提供IP和Chiplet解決方案的RISC-V IP,Tensorrent將提供為Tensix提供IP、Chiplet、芯片、板卡、系統到云的一整套方案。不過將于今年推出的Grendel,將采用CPU+ML Chiplet的設計方案,屆時應該會打通Tensorrent現有的RISC-V CPU和AI IP方案。
除了已經開放購買的一些開發板、擴展卡產品外,Jim Keller也在不遺余力地為Tenstorrent尋找生態鏈伙伴,無論是三星、臺積電這樣的晶圓代工廠,還是Silicon Box 這樣的Chiplet制造廠商等,都與其達成了合作。
寫在最后
如果單從絕對性能上看,目前RISC-V處理器和主流x86產品還是存在一些差距,但其實隨著HPC和AI需求暴漲,在相關的應用開發上,大家已經意識到一味地追求計算性能本身帶來的收益越來越少,反而是對架構、指令集等進行優化帶來的收益越來越高。而RISC-V架構的靈活可定制性,恰恰給到了彎道超車的機會。
不過高性能處理器依然是一個必備的敲門磚,因此RISC-V在HPC領域還有很長的一段路要走。除此之外,如何與現有的HPC供應鏈和開發生態達成協作,是RISC-V必須考慮的一件事,比如如何與服務器OEM合作,按照OCP項目的標準打造通用的服務器解決方案;又或是如何把盡快將眾多關鍵HPC庫和工具移植到RISC-V的硬件平臺之上。
-
HPC
+關注
關注
0文章
315瀏覽量
23754 -
RISC-V
+關注
關注
45文章
2270瀏覽量
46131
發布評論請先 登錄
相關推薦
評論