近日,ARM正式宣布推出ARMv9架構。據ARM官方稱,這是10年來最重要的創(chuàng)新,是未來3000億ARM芯片的基礎。
與上一代的ARMv8相比,ARMv9處理器將不再局限于移動/嵌入式市場,而是擴展到PC、HPC高性能計算、深度學習等新市場,以滿足全球對功能日益強大的安全、人工智能和專用處理的需求。
ARMv9架構的發(fā)布,會對CPU市場帶來什么樣的影響?對于中國而言,是否能夠解“缺芯”之急呢?
ARMv9的三大亮點
2011年10月,ARM首次發(fā)布ARMv8架構,十年后的今天,ARMv9立足于ARMv8的成功基礎,將成為擔綱未來十年的主流計算架構。那么,它和ARMv8架構相比有哪些不同呢?
據ARM高級副總裁、首席架構師兼技術院士Richard Grisenthwaite介紹,ARMv9繼續(xù)使用AArch64作為基準指令集,但是在其功能上增加了一些非常重要的擴展。
他指出ARMv9有三個主要支柱,即:安全性、AI(機器學習)以及改進的矢量和DSP功能。
亮點一:安全
為了解決當今最大的技術挑戰(zhàn)——保護全球數據安全,ARMv9架構路線圖引入了ARM機密計算架構(Confidential Compute Architecture, CCA)。
機密計算通過打造基于硬件的安全運行環(huán)境來執(zhí)行計算,保護部分代碼和數據,免于被存取或修改,甚至不受特權軟件的影響。
例如,在ARM TrustZone的基礎上,可以將個人銀行信息與智能手機的社交媒體應用完全分離。ARM CCA的新安全功能意味著,即使社交媒體應用真的感染了惡意軟件,也不會傳播設備其他部分。
ARM CCA還引入動態(tài)創(chuàng)建機密領域(Realms)的概念,機密領域面向所有應用,運行在獨立于安全或非安全環(huán)境之外的環(huán)境中,以實現保護數據安全的目的。
例如,在商業(yè)應用中,機密領域可以保護系統(tǒng)中商用機密數據和代碼,無論它們正被使用、閑置或正在傳輸中。在云中,這也意味著保護物理CPU以及運行在第三方代碼旁邊的虛擬化處理器。
此外,ARM持續(xù)與谷歌合作開發(fā)的內存標簽擴展(MTE)技術,將成為第一代基于ARMv9-A處理器的一個組成部分。
過去30年中,許多廣為人知的數據安全漏洞,都是利用計算機如何存儲和調用內存中的數據的漏洞造成的。如果黑客知道一串重要數據的位置,他們就可以用惡意代碼覆蓋它。
MTE使開發(fā)人員能夠使用“標簽”鎖定數據串。然后,只有使用正確的密鑰才能訪問該數據,該密鑰由“指針”(負責從內存中調用數據的代碼)持有。實現鎖和密鑰訪問是一個巨大的步驟,不僅可以確保數據的安全,而且還可以保證數據的安全。
亮點二:針對AI機器學習的優(yōu)化
機器學習是ARMv9的重要組成部分,ARM認為在未來幾年中,越來越多的機器學習工作負載將變得司空見慣。
為了滿足這一需求,ARM與富士通合作開發(fā)了可伸縮矢量擴展(Scalable Vector Extension, SVE)技術,并驅動了世界上最快的超級計算機“富岳”。在此基礎上,ARM為ARMv9開發(fā)了SVE2,以便在更廣泛的應用中實現增強的機器學習和數字信號處理能力。
除了增加的各種現代SIMD功能外,SVE和SVE2的優(yōu)勢還在于其可變的向量大小,范圍覆蓋了128b到2048b,讓其無論在什么硬件運行,都允許向量的可變粒度為128b。
如果純粹從向量處理和編程的角度來看,這意味著軟件開發(fā)人員將只需要編譯一次其代碼,并且如果將來某個CPU帶有本地的512b SIMD execution pipelines,該代碼將能夠充分利用單元的整個寬度。
同樣,相同的代碼將能夠在具有較低硬件執(zhí)行寬度能力的保守設計上運行,這對于ARM設計從物聯網、移動到數據中心的CPU而言至關重要。在保留ARM體系結構的32b編碼空間的同時,它還可以完成所有這些工作。然而,類似X86這樣的架構,則需要根據矢量尺寸增加新的指令和擴展。
SVE2增強了對在CPU上本地運行的5G系統(tǒng)、虛擬和增強現實以及機器學習工作負載的處理能力,如:圖像處理和智能家居應用。
未來幾年,ARM將進一步擴展其技術的AI能力,除了在其Mali GPU和Ethos NPU中持續(xù)進行AI創(chuàng)新外,還將大幅增強CPU內的矩陣乘法。
亮點三:通過系統(tǒng)設計實現性能最大化
在過去的五年,ARM技術每年都以超過業(yè)界的速度提升CPU性能。ARM在新一代架構ARMv9上將保持這個速度,預計未來兩代移動和基礎設施CPU的性能提升將超過30%。
據ARM官方稱,這個數據是根據業(yè)界標準評測工具來衡量,30%的算力提升完全是憑借于本身架構,而不是借助于制程工藝來實現的。
然而,隨著行業(yè)從通用計算向普遍的專用處理發(fā)展,每年兩位數的CPU性能提升是不夠的。除了增強專用處理能力,ARM的全面計算(Total Compute)設計方法,將通過集中的系統(tǒng)級硬件和軟件優(yōu)化以及用例性能的提高,加速總體計算性能。
通過將全面計算的設計原則應用在包含汽車、客戶端、基礎設施和物聯網解決方案的整個IP組合中,ARMv9系統(tǒng)級技術將遍及整個IP解決方案,并改善個別IP。
此外,ARM還在開發(fā)多項技術以提高頻率、帶寬、緩存,并降低內存延遲,從而最大限度地提升基于ARMv9的CPU性能。
ARM欲打破x86壟斷
目前,CPU領域最成功的架構當屬x86,不過x86的成功和統(tǒng)治力在于PC和高性能計算市場,在ARM擅長的智能終端市場并不成功。
近幾年,ARM架構在高性能計算領域取得了一些進展,包括上面提到的“富岳”超級計算機,以及推出采用ARM架構的多款服務器。
去年,蘋果基于ARM架構推出M1處理器,并成功應用在Macbook Pro電腦上。此外,高通、微軟也在布局基于ARM架構的電腦處理器和系統(tǒng)。這一系列的舉動,都讓業(yè)界看到了x86架構在PC市場的統(tǒng)治地位并非牢不可破。
ARM首席執(zhí)行官Simon Segars說,“ARM芯片實現1000億顆的出貨花了26年,如果預測準確,接下來一年,我們的合作伙伴出貨的ARM芯片將累計達到2000億顆。也就是說,我們的第二個1000億的出貨將在短短5年內達成。”
據媒體報道,目前ARM架構的芯片出貨已經超過1800億顆,ARMv9架構會成為實現ARM芯片3000億顆芯片出貨的先驅。
沒有人能準確預估ARM實現第三個1000億顆芯片出貨的時間,但可以明確的是,ARM希望其芯片能夠為所有智能計算提供算力,也就是讓其芯片在未來無處不在。
現在看來,在復雜的國際形勢下,同屬精簡指令集的RISC-V正在快速發(fā)展,加上x86陣營Intel和AMD也在加強x86的競爭力,ARM要真正撼動x86的優(yōu)勢領域并非易事。
華為能否獲得ARMv9授權?
不過,相比于ARMv9到底更新了哪些功能,國內關注更多的還是華為能否獲得ARMv9的授權。
據悉,華為自主研發(fā)的海思芯片就是基于ARM架構設計的。在美國出臺芯片禁令之時,華為方面表示,已經獲得了ARMv8架構授權,可以自主設計處理器,并掌握到核心技術。
雖然華為掌握著ARMv8架構,但沒有最新構架的支持,華為也將陷入停滯不前的狀態(tài)。
對于ARMv9是否以供給包括華為在內的中國企業(yè)的問題,ARM的官方回復是:
“ARM既有源于美國的IP,也有非源于美國的IP。經過全面的審查,ARM確定其ARMv9架構不受美國出口管理條例(EAR)的約束。ARM已將此通知美國政府相關部門,我們將繼續(xù)遵守美國商務部針對華為及其附屬公司海思的指導方針。”
細品這番發(fā)言,ARM的態(tài)度實在是模棱兩可:
ARM官方沒有說任何關于ARMv9可以授權給華為的事情。
第二,從ARM官網上可以看到,谷歌、英偉達、高通、小米、OPPO、VIVO、聯發(fā)科、臺積電都是ARM的合作伙伴,但是華為卻不見蹤影,可見這件事背后,還是有一些隱情。
換句話說,華為能否得到ARMv9的授權,其實還是一個未知數。
另一方面,即使華為得到v9的授權,但芯片制造依然是一個大問題。
同時,國內業(yè)界也在擔憂,在ARM新架構之下,快速進軍PC和服務器業(yè)務,這會對我國硬件國產化以及系統(tǒng)國產化帶來更大壓力。
? ? ? 責任編輯:tzh
評論
查看更多