從全面升級(jí)到Armv9架構(gòu),到公布Neoverse V1和N2平臺(tái)技術(shù)細(xì)節(jié),再到推出三款基于Armv9架構(gòu)的全新CPU內(nèi)核,短短兩個(gè)月時(shí)間里,Arm全面計(jì)算(Arm Total Compute)戰(zhàn)略正在以令人難以置信的速度加速推進(jìn),密集,但有條不紊。
何為“全面計(jì)算”
其實(shí)在2019年,Arm就提出要在共同架構(gòu)下推動(dòng)全面計(jì)算,旨在解決單個(gè)IP與碎片化解決方案優(yōu)化問(wèn)題時(shí)面臨的重大挑戰(zhàn),并隨后發(fā)布了Total Compute解決方案白皮書(shū)。這意味著,在解決系統(tǒng)創(chuàng)新設(shè)計(jì)的挑戰(zhàn)時(shí),Arm需要將關(guān)注焦點(diǎn)逐漸從單一的產(chǎn)品演進(jìn),轉(zhuǎn)化為以應(yīng)用場(chǎng)景與體驗(yàn)為導(dǎo)向的系統(tǒng)解決方案,要對(duì)硬件IP、物理IP、軟件、工具、以及彼此間的協(xié)作進(jìn)行全面優(yōu)化。
這是在思考方式上做出的重大轉(zhuǎn)變。
Arm全新的IP設(shè)計(jì)思路可以歸納為兩點(diǎn):一是以應(yīng)用場(chǎng)景、消費(fèi)者體驗(yàn)與生態(tài)系統(tǒng)的需求為核心;二是深度聚焦在性能、安全性與開(kāi)發(fā)人員介入權(quán)的優(yōu)化,從而為未來(lái)的計(jì)算平臺(tái)提供安全的基礎(chǔ),提升性能與效率,給予開(kāi)發(fā)人員通過(guò)整個(gè)Arm生態(tài)系統(tǒng)獲取更多性能的機(jī)會(huì)。
Arm高級(jí)副總裁兼終端設(shè)備事業(yè)部總經(jīng)理Paul Williamson表示,在全面計(jì)算的概念下,IP之間的PPA(性能、功率、面積)原則也許不再是最重要的,反而是系統(tǒng)級(jí)的性能更為重要。此外,要確保開(kāi)發(fā)者擁有最佳的開(kāi)發(fā)體驗(yàn)、并且對(duì)每一臺(tái)設(shè)備的性能與安全功能都有更簡(jiǎn)易的取用途徑。
來(lái)自Arm的最新統(tǒng)計(jì)數(shù)據(jù)顯示,僅在2020年Q4季度,Arm芯片合作伙伴就出貨了73億顆Arm架構(gòu)芯片(年增22%),相當(dāng)于每秒出貨超過(guò)900顆芯片、每日出貨7000萬(wàn)顆芯片,創(chuàng)下出貨量歷史新高。而2020年的總出貨量更是高達(dá)250億顆(年增13%)累計(jì)總數(shù)已超過(guò)1,900 億。同時(shí),Arm Mali GPU出貨量累計(jì)超過(guò)80億顆,其中2020年出貨超過(guò)10億,持續(xù)位居全球GPU出貨量榜首。
授權(quán)業(yè)務(wù)方面,2020財(cái)年,Arm與104家客戶簽署了162個(gè)授權(quán)協(xié)議,其中有超過(guò)一半的授權(quán)對(duì)象為首次與Arm合作的企業(yè)。Arm Flexible Access 目前已有 90 家合作伙伴,通過(guò)該計(jì)劃,這些合作伙伴可以更容易地獲取各項(xiàng)全球領(lǐng)先的 Arm IP、工具與支持。
按照Paul Williamson的說(shuō)法,Armv9帶來(lái)了落實(shí)全面計(jì)算設(shè)計(jì)戰(zhàn)略的三大關(guān)鍵原則:首先是安全性,主要是引入內(nèi)存標(biāo)簽擴(kuò)展(MTE)、指針驗(yàn)證(pointer authentication, PA)等新的安全技術(shù);其次是開(kāi)發(fā)者可及性,例如在機(jī)器學(xué)習(xí)方面,通過(guò)支持BFloat16格式更好地去支撐Int8計(jì)算和BFloat16?的Matmul;第三是計(jì)算性能,通過(guò)提升可伸縮矢量擴(kuò)展能力,能夠更好地幫助開(kāi)發(fā)者對(duì)高階的應(yīng)用場(chǎng)景進(jìn)行開(kāi)發(fā),比如圖像信號(hào)處理。
“Arm正致力于將Armv9技術(shù)引入包括筆記本電腦、臺(tái)式機(jī)、云、5G網(wǎng)絡(luò)、數(shù)據(jù)中心、更多終端與車(chē)載架構(gòu)計(jì)算在內(nèi)的各個(gè)領(lǐng)域,借助移動(dòng)生態(tài)系統(tǒng)的規(guī)模優(yōu)勢(shì),以系統(tǒng)級(jí)設(shè)計(jì)最大程度地提高性能。”P(pán)aul Williamson說(shuō),目前來(lái)看,全面計(jì)算在高性能應(yīng)用場(chǎng)景(游戲生態(tài)、擁有豐富人工智能功能的應(yīng)用)、涉及安全功能的應(yīng)用場(chǎng)景(安全交易、銀行類(lèi)應(yīng)用、設(shè)備端個(gè)人數(shù)據(jù)保護(hù)等)中將會(huì)擁有更高的接受度。
例如在游戲中,“我們測(cè)量了整個(gè)游戲內(nèi)容中全面計(jì)算系統(tǒng)優(yōu)化的結(jié)果,每個(gè)系統(tǒng)組件都有助于性能的提升。Cortex-A710 CPU在運(yùn)行驅(qū)動(dòng)工作負(fù)載時(shí),帶來(lái)了33%的性能提升;Mali-G710帶來(lái)了20%的性能提升,我們的系統(tǒng)級(jí)IP提供了15%的效率提升。”
再比如在AI中,“不同的Arm IP上運(yùn)行多樣的AI工作服在帶來(lái)的巨大性能提升。這些性能提升各異,從Mali-G710平均35%的提升,到Cortex-M55的高達(dá)700%的提升,真是針對(duì)能耗有限制的工作負(fù)載,例如關(guān)鍵字偵測(cè)。”
在多種不同應(yīng)用場(chǎng)景之間進(jìn)行設(shè)計(jì)權(quán)衡是比較困難的。因此,Arm全面計(jì)算框架的推出為生態(tài)系統(tǒng)合作伙伴提供了跨多種應(yīng)用的可擴(kuò)展性,也為具體的場(chǎng)景用例提供了特定的加速或增強(qiáng)功能,既能針對(duì)應(yīng)用場(chǎng)景構(gòu)建優(yōu)化的解決方案,同時(shí)也能平衡解決方案的性能和成本,這是下游設(shè)計(jì)真正需要的,在真實(shí)的用例中也非常有價(jià)值。
高筑墻,廣積糧
關(guān)于Armv9架構(gòu)和Neoverse V1/N2平臺(tái)技術(shù)的更多內(nèi)容,本刊此前曾進(jìn)行過(guò)持續(xù)追蹤報(bào)道,有興趣的讀者可點(diǎn)擊《Armv9細(xì)節(jié)公布,Arm迎來(lái)十年最大架構(gòu)革新》、《性能如此強(qiáng)悍的服務(wù)器CPU對(duì)Arm意味著什么?》等文章進(jìn)行了解,本文將更多介紹最新推出的IP套件,包括:首批Armv9 Cortex CPU、Mali GPU和全新的CoreLink系統(tǒng) IP,共計(jì)10款產(chǎn)品。
Arm Cortex CPU:全面計(jì)算解決方案的基石
三款A(yù)rmv9架構(gòu)的CPU核包括:旗艦級(jí)Cortex-X2、大核CPU Cortex-A710、高效率小核Cortex-A510。
其中,Cortex-X2主要面向智能手機(jī)市場(chǎng),相比于Cortex-X1,性能提升16%,可將旗艦型安卓智能手機(jī)的性能在當(dāng)前基礎(chǔ)上再提升30%。除了峰值性能外,Cortex-X2還可在旗艦智能手機(jī)和筆記本電腦之間擴(kuò)展,使合作伙伴可以根據(jù)市場(chǎng)需求來(lái)設(shè)計(jì)基于不同場(chǎng)景的計(jì)算能力。
Cortex-A710是首款基于Armv9架構(gòu)的大核CPU,與Cortex-A78相比,能效提升30%,性能提升10%。通過(guò)性能和效率的提升,當(dāng)智能手機(jī)運(yùn)行高要求的App時(shí),用戶將獲得比以往更長(zhǎng)的使用時(shí)間以及更優(yōu)化的體驗(yàn)。
Cortex-A510是Arm過(guò)去四年來(lái)推出的首款高效率小核,其性能提升35%,機(jī)器學(xué)習(xí)性能提升超過(guò)3倍。它所帶來(lái)的性能水平已經(jīng)接近幾年前推出的上一代大核Cortex-A73,性能差距不到10%,但能效優(yōu)化可達(dá)35%,適用于智能手機(jī)、家用設(shè)備和可穿戴設(shè)備。
Armv9-A CPU集群的支柱是新款的動(dòng)態(tài)共享單元(DynamIQ Shared Unit)DSU-110,該組件可為不同的細(xì)分市場(chǎng)提供各種解決方案。DSU-110具備可擴(kuò)展性,可支持多達(dá)八個(gè)Cortex-X2內(nèi)核配置,也難怪Williamson在介紹中說(shuō),“一臺(tái)基于Cortex-X2的筆記本電腦比起2020年市場(chǎng)主流的筆記本,其單線程性能可領(lǐng)先40%。“
在2021年消費(fèi)設(shè)備中常見(jiàn)的“1超大核+3大核+4小核,4MB L3(DSU)” Tri-Cluster CPU架構(gòu)中,如果將X1替換為X2,A78替換為A710,A55替換為A510,DSU替換為DSU-110,4MB L3(DSU)替換為8MB L3(DSU-110),預(yù)計(jì)2022年終端設(shè)備的峰值性能將會(huì)提升30%,持續(xù)性能將會(huì)提升30%,小核性能將會(huì)提升35%。
面向細(xì)分市場(chǎng)的新款 Arm Mali GPU套件
視覺(jué)體驗(yàn)仍然是消費(fèi)者與設(shè)備交互、并享用設(shè)備的關(guān)鍵,Arm新推出面向廣泛應(yīng)用的多款GPU,搭配Armv9 CPU,繼續(xù)提升用戶體驗(yàn)。
最新的Arm Mali-G710是針對(duì)旗艦智能手機(jī)和Chromebook筆記本市場(chǎng)的高性能 GPU,在計(jì)算密集型體驗(yàn)方面的性能提升20%(如AAA高保真游戲)。對(duì)于與機(jī)器學(xué)習(xí)有關(guān)的任務(wù)(如全新相機(jī)和視頻模式的圖像增強(qiáng)),Mali-G710也帶來(lái)35%的機(jī)器學(xué)習(xí)性能提升。
作為次旗艦GPU,Mali-G610繼承了Mali-G710 的功能,但價(jià)格更低,可將高階應(yīng)用場(chǎng)景帶給更多的開(kāi)發(fā)者和消費(fèi)者。
Mali-G510實(shí)現(xiàn)了性能和效率的較好平衡,在中端智能手機(jī)、旗艦智能電視和機(jī)頂盒上,實(shí)現(xiàn)了100%的性能提升以及22%的節(jié)能優(yōu)化,從而延長(zhǎng)了電池續(xù)航時(shí)間,提升了100%的機(jī)器學(xué)習(xí)性能。
Mali-G310是Arm目前最高效的GPU,以最小的面積成本提供了最高的性能。通過(guò)Mali-G310,Valhall架構(gòu)和高質(zhì)量圖形技術(shù)將被引入到更低成本的設(shè)備中,例如入門(mén)級(jí)智能手機(jī)、AR設(shè)備和可穿戴設(shè)備。
提升系統(tǒng)性能的互連技術(shù)
互連技術(shù)對(duì)于提高系統(tǒng)性能至關(guān)重要。最新的CoreLink CI-700一致性互連技術(shù)和CoreLink NI-700片上網(wǎng)絡(luò)互連技術(shù),可與Arm CPU、GPU和NPU IP無(wú)縫搭配,跨 SoC解決方案增強(qiáng)系統(tǒng)性能。CoreLink CI-700和CoreLink NI-700對(duì)新的Armv9-A功能提供硬件級(jí)支持,如內(nèi)存標(biāo)簽擴(kuò)展(Memory Tagging Extension),支持更高的安全性、改進(jìn)的帶寬和延遲。
可以看出,全新的全面計(jì)算解決方案是系統(tǒng)范圍內(nèi)整體優(yōu)化的思路,橫跨硬件 IP、物理 IP、軟件、工具和標(biāo)準(zhǔn),能夠?yàn)楹献骰锇樘峁└鼮閺V泛的選擇,以滿足細(xì)分市場(chǎng)的應(yīng)用場(chǎng)景和成本區(qū)間需求。同時(shí),這也將解鎖整個(gè)生態(tài)系統(tǒng)的新體驗(yàn),例如,專(zhuān)為移動(dòng)設(shè)備設(shè)計(jì)、支持 AI 功能的交互式應(yīng)用場(chǎng)景,可以使用戶身臨其境觀看電視8K內(nèi)容等體驗(yàn)。
2023年移動(dòng)應(yīng)用產(chǎn)品僅提供64位大、小核
隨著IP戰(zhàn)略的升級(jí),Arm宣布,將在2023 年面向移動(dòng)應(yīng)用僅提供64位的大核和小核。為此,Arm全球合作伙伴正在努力確保所有App都將在今年年底前支持64位。
據(jù)Paul Williamson介紹,Cortex-X2是完全面向智能手機(jī)市場(chǎng)的產(chǎn)品,預(yù)計(jì)在未來(lái)幾代手機(jī)產(chǎn)品中就能看到Cortex-X2的身影。對(duì)智能手機(jī)和其他終端計(jì)算設(shè)備而言,64位將提供終極的性能表現(xiàn)。Arm目前正與中國(guó)應(yīng)用商店生態(tài)合作伙伴進(jìn)行密切協(xié)作,確保主要App都能在今年年底前支持 64 位,從而為中國(guó)消費(fèi)者提供Cortex-X2所帶來(lái)的性能提升體驗(yàn)。
Arm方面透露,向64位過(guò)渡需要分階段實(shí)現(xiàn),目前,Cortex-X2、Cortex-A510已經(jīng)是64位CPU,A710仍然支持32位。預(yù)計(jì)到2023年,Arm在移動(dòng)應(yīng)用的大核跟小核都將僅支持64位。
結(jié)語(yǔ):
Paul Williamson總結(jié)稱(chēng),Arm合作伙伴希望能夠?qū)⑿缕犯焖俚赝葡蚴袌?chǎng),而全面計(jì)算解決方案包含了SoC設(shè)計(jì)流程中所需要的一切組件:硬件 IP、軟件、物理IP、工具和標(biāo)準(zhǔn),將使合作伙伴在應(yīng)對(duì)所有終端市場(chǎng)上SoC復(fù)雜性時(shí)受益,讓他們能夠滿懷信心地通過(guò)最新的技術(shù),將高性能的產(chǎn)品快速推向市場(chǎng)。
責(zé)任編輯:pj
-
芯片
+關(guān)注
關(guān)注
459文章
51757瀏覽量
431282 -
ARM
+關(guān)注
關(guān)注
134文章
9242瀏覽量
372234 -
cpu
+關(guān)注
關(guān)注
68文章
10977瀏覽量
214516 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9518瀏覽量
86730
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
Arm下一代指令架構(gòu)“Armv9”已經(jīng)問(wèn)世
十年來(lái)最大技術(shù)革新!Arm發(fā)布Armv9架構(gòu)!不受美國(guó)EAR約束,華為可獲授權(quán)!
安謀科技:十年磨一劍的Armv9架構(gòu),下半年將有終端面市
基于ARMv7架構(gòu)的Cortex系列
重磅!Arm正式推出Armv9架構(gòu)

Arm推出Arm?v9架構(gòu) 面向人工智能、安全和專(zhuān)用計(jì)算的未來(lái)
Arm確定其Armv9架構(gòu)不受美國(guó)出口管理?xiàng)l例(EAR)的約束
淺談ARM發(fā)布Armv9的三大改進(jìn)
Arm公司正式發(fā)布了該公司的新一代Armv9架構(gòu)的首個(gè)細(xì)節(jié)

評(píng)論