Arm架構在如今的電子行業中可以說是無處不在。自1990年Arm公司正式成立Armv4架構到2011年Armv8架構,短短21年架構經過了5次重大升級。而Armv8意味著Arm正是從AArch32邁進AArch64,憑借強大的實力在過去的五年基于Arm架構的設備出貨量超過了1000億。
十年轉瞬,Armv9架構終于露出廬山真面目,適用于Arm全系列芯片的Armv9架構,這次的升級瞄準的則是日益強大的安全、人工智能(AI)和無處不在的專用處理的需求。實際上,Armv9架構的推出也與正預示著行業的發展方向。憑借新架構,Arm提出了3000億的目標。
Armv9的三個技術特性
根據Arm高級副總裁、首席架構師兼技術院士Richard Grisenthwaite的介紹,Armv9架構是基于Armv8既往成功的基礎,并增添了針對矢量處理的DSP、機器學習ML、安全等這三個技術特性。
Armv8之所以“統治”市場十年之久,最大的升級點便是引入了64架構,即AArch64,這也是Arm版本升級最大的一次改變。除此之外,AArch64摒棄了此前的處理器模式、優先級級別等傳統概念,提出了EL(Exception level),并在兼容設計上定義了兩套運行環境ES(Execution state)。這些也都被Armv9所繼承,可以說Armv9是集大成者,將Arm三十多年的核心完美繼承下來。
矢量處理的DSP、機器學習ML處理能力提升要歸功于可伸縮矢量擴展(SVE2)和矩陣乘法指令的引入。相比SVE的128位矢量,SVE2可以支持多倍128位運算,最多2048位,因此才有如此魔力可以增強對在CPU上本地運行的5G系統、虛擬和增強現實以及ML工作負載的處理能力。
根據Richard Grisenthwaite的介紹,SVE2增強多項DSP和機器學習ML處理能力,例如Scatter-Gather DMA直接存儲器訪問,把它放到CPU架構中,能實現更多的循環,更大的DSP處理能力,從而支持更多的并行化。
安全能力提升則主要是通過Arm推出的全新的機密計算架構CCA(Confidential Compute Architecture)實現,根據介紹CCA通過打造基于硬件的安全運行環境來執行計算,保護部分代碼和數據,免于被存取或修改,甚至不受特權軟件的影響。同時還將基于此前的TrustZone安全技術引入動態創建機密領域(Realms)的概念,機密領域面向所有應用,運行在獨立于安全或非安全環境之外的環境中,以實現保護數據安全的目的。
Armv9在算力上的提升
提到架構的升級,就離不開算力這一個話題,Armv9架構能夠為Arm后兩代產品提供30%的性能提升。根據介紹,以智能手機等移動平臺使用的Cortex-X/A系列為例,X1/A78這一代的性能相比16nm A72提升2.5倍,下一代的Matterhorn架構及Makalu架構會保持30%以上的IPC性能提升。
除了CPU性能以外,Armv9還非常重視整體的性能提升,包括降低內存延遲(從150ns降至90ns)、頻率提升(從2.6GHz到3.3GHz)內存帶寬(從20GB/s到60GB/s)、緩存等。
Richard Grisenthwaite強調,Arm在新一代架構Armv9上將保持這個速度,預計未來兩代移動和基礎設施CPU的性能提升將超過30%。,這個數據是根據業界標準評測工具來衡量的,而且這樣30%的算力提升完全是憑借于本身的架構而不是借助于制程工藝來實現。
另外,隨著摩爾定律正在放緩,如何進一步提升算力呢?他認為,Arm將通過最大化地提升頻率、帶寬、緩存大小、并減少內存延遲,以最大化CPU性能。
除了CPU,Arm還表示Mali GPU會增加更多高級功能,例如VRS可變幀率渲染、RT光線追蹤及其他高級渲染技術等。
由Armv9引發的市場競爭力
實際上,在去年Arm發布Arm? Cortex?-M55處理器和Arm Ethos?-U55神經網絡處理器(NPU)兩款重磅“性能炸彈”時,就已開始蓄力發展人工智能(AI)。Cortex-M55是Arm歷來AI能力最為強大的Cortex-M處理器,能夠大幅提升DSP與ML的性能,同時更省電。
反觀行業趨勢,應用開始要求提供更高的數字信號處理(DSP)性能,實時算法的復雜程度增加和浮點算法趨勢下,DSP核或硬件加速單元越來越多被部署內嵌在器件之中。DSP一直影響著下一代產品創新,這是因為許多算法在字長和動態范圍有著很高的要求,DSP可免去定點到浮點的轉化工作加速產品上市,另外DSP浮點計算成本越來越接近定點計算。正因如此,便形成了Arm+DSP內核的黃金搭檔。
另外,行業也正在將越來越多的機器學習工作負載變得更加普遍,雖然機器學習有著許多專用的加速器,不過相比來說大量的小范圍機器學習的主力仍然是CPU,因此矩陣乘法指令成為關鍵。
在安全性能上,Arm曾在此前進行了多維度的功能增強,包括PSA認證、TrustZone等。目前PSA認證已經有有超過35個合作伙伴提供的60多種認證產品,而新推出的CCA則也將基于TrustZone提供更加安全的架構。
從Armv9著眼的點來看,行業正逐漸對算力功耗平衡性和安全性能要求提高。Arm架構可用在物聯網的大部分設備之上,因此對這兩項要求更加吃緊。大數據時代爆炸量的信息增長下,一方面將計算分成了多個維度,另一方面將會對數據安全提出更高的要求。
根據Arm的介紹,搭載ARMv9處理器的芯片最快在2021年年底就會面世,物聯網發展日趨成熟,這個時間點恰好提升競爭力的好時機。市場或將擁有追求極致計算性能的高端產品、超低功耗的省電高手、主打安全可靠的產品。而Armv9經過架構的更新,能夠從底層和非制程方向進行大改革,相信能為市場帶來新的競爭力。
而在廣為受關注的國內授權問題上,Arm強調:“Arm既有源于美國的IP,也有非源于美國的IP。經過全面的審查,Arm確定其Armv9架構不受美國出口管理條例(EAR)的約束。Arm已將此通知美國政府相關部門,我們將繼續遵守美國商務部針對華為及其附屬公司海思的指導方針。”
編輯:lyn
-
dsp
+關注
關注
555文章
8141瀏覽量
355113 -
cpu
+關注
關注
68文章
11031瀏覽量
215932 -
arm9
+關注
關注
2文章
290瀏覽量
55496 -
機器學習
+關注
關注
66文章
8490瀏覽量
134042
發布評論請先 登錄
三星電子任命半導體專家入董,強化AI市場競爭力
芯和半導體榮獲2024上海軟件核心競爭力企業
基于Armv9架構的MediaTek天璣8400移動芯片問世
中國AI企業創新降低成本打造競爭力模型
Armv9 CPU中SVE2的實際用例

評論