5月29日Arm正式推出 Arm 2023 全面計算解決方案(TCS23), 包含基于全新第五代 GPU 架構、可實現終極視覺體驗的全新Arm Immortalis GPU,助力 Arm 面向下一代人AI保持性能領先的全新 Armv9 CPU 集群,以及可為數百萬 Arm 開發者提供更易訪問軟件的全新增強技術,為整個系統的關鍵工作負載帶來了顯著提升。
近日,在媒體技術日活動上,多位Arm技術專家來到現場分享了TCS23的技術特征以及智能移動設備發展的前瞻洞察。Arm 產品營銷副總裁 Ian Smythe首先介紹了TCS23的整體性能優勢。
全新 Armv9 Cortex 計算集群已連續三年實現兩位數的性能提升。TCS23的計算集群包括超大核Cortex-X4,大核處理器 Cortex-A720 和小核 Cortex-A520。也推出了全新DSU-120 ,專門為了滿足高要求的多線程用例而設計。基于第五代架構的 GPU即Immortalis-G720,專為旗艦智能手機而設計,可帶來 15% 的性能提升,減少了多達 40% 的內存帶寬用量,有助于實現更出色且持久的幀率,最終帶來更高質量的圖形。提供 64 位計算性能、支持安全創新,遷移到 64 位系統的任務已經完成。Arm 的內存標記擴展MTE 功能,支持開發者在應用部署前后,都能檢測和避免內存安全漏洞。Ian還表示,在接下來的幾年里,我們將在包括 Krake GPU 和 Blackhawk CPU 等關鍵 IP 上加大投入,以滿足合作伙伴對于計算和圖形性能的要求。
TCS23全面計算解決方案包括工具、軟件以及各種硬件產品,例如Arm 架構以及再底層的物理 IP、POP IP。TCS23在底層 IP上有了全新的更新,同時在工具上也提供了新的產品,在GPU上新品,進一步提高性能和效率。同時,Arm還推出了僅支持 64 位、且基于 Armv9.2 架構的CPU集群,提供了全新的系統級IP 以及開發工具。
全面升級CPU核,以及DSU-120支持最高多達14個內核的可擴展配置
Cortex-X4 是Arm打造過性能最快速的CPU,與 Cortex-X3 相比,Cortex-X4 的性能提高了15%,并帶來可以顯著降低功耗多達 40% 的高能效微架構。而面積僅增加了 10%,這是Cortex-X系列處理器中,在每平方毫米的性能方面最出類拔萃的產品。不論是更快速的即時應用響應,或是更流暢的網頁瀏覽體驗, Cortex-X4 的增強性能將為設備帶來顯著的升級。包括 3A 級游戲、全天候生產力和后臺任務在內的用例,是移動設備中極其重要的部分,而能效則是高效運行此類用例必不可少的關鍵。
全新的大核處理器 Cortex-A720 和全新小核 Cortex-A520,與其上一代相比,雙雙在能效方面都提高了 20%。Cortex-A720 是業界主流的 CPU IP,可提高持續性能,是新 CPU 集群的核心主力,而Cortex-A520 是我們最出眾的高效性能核心。
由于高端移動設備的芯片設計越來越復雜,要面對用戶體驗的升級、新軟件功能的需求和更高性能和效率的持續突破,TCS23基于全新 Armv9.2 架構搭建,可以為客戶提供突破能效和性能邊界所需的前沿技術,客戶可以基于 TCS23 進行不同配置,從而自行創建可擴展性高的計算解決方案。這里不僅包括智能手機,還有高端數字電視、機頂盒等等。
Arm 終端事業部產品管理高級總監Kinjal Dave談到,在Armv9.2 計算集群中除了全新 Cortex-X4、Cortex-A720 和 Cortex-A520 CPU,還有DynamIQ Shared Unit DSU-120。全新的 DSU-120基于兩年前推出的 DSU-110 開發, 針對 DSU 的各方各面進行了優化提升。 在擴展性方面,新款 DSU-120 支持最高多達 14 個的內核和更大的L3緩存,可助力構建比前代產品更強大、性能更高的 CPU 集群。無論是搭載于高性能筆記本電腦中的由十核 Cortex-X4 和四核 Cortex-A720 CPU 所組成的集群,還是用于旗艦智能手機中的由單核 Cortex-X4、四核 Cortex-A720 和四核 Cortex-A520 所組成的集群,高度可擴展的 DSU 都為 Arm 2023 全面計算解決方案(TCS23)奠定了根基。
DSU-120 還提供了全新的先進功能,例如智能節能模式,它有助于提高整個 CPU 集群的效率。更高級別的效率表現能延長特定集群所針對的任何消費電子設備的工作天數。DSU-120 還新增了24MB 和 32MB的 L3 緩存配置選項,進而使得對應集群擁有更高的性能和更低的系統功耗。
在高端數字電視和機頂盒,以及中端智能手機應用中,TCS23配置側重于提供具有超高可擴展性的高級圖形和計算性能,實現出色的用戶體驗。舉例來說,數字電視可以具備多視圖功能,例如同時在屏幕上顯示視頻通話、視頻流應用和 AI 應用等多個任務。更高的性能還可實現先進機器學習功能,以提升相機和視頻應用場景的相關用戶體驗。
除此之外,TCS23 為注重成本的市場準備了多款配置選擇,例如由全新 Cortex-A520 提供支持的可擴展 CPU 小核集群,以及可擴展的 Mali GPU。
GPU的三大關鍵提升
第五代架構提高了所有 GPU 的系統級圖形性能,聚焦三個關鍵處理趨勢,即場景復雜性、更出色的圖形性能和內存系統能耗功率。
隨著開發者紛紛設法實現更優質的視覺效果,移動設備上的場景復雜性也呈爆炸式增長?,F在面臨的挑戰在于,更高的場景復雜性會讓幾何相關的內存訪問占據過多的可用帶寬,并最終影響性能。
為了處理這些更復雜的場景,圖形管道首先引入了延遲頂點著色 (DVS) 以重新定義 Arm GPU 中的圖形數據流。DVS 利于性能隨內核數增加而提升,使 Arm 的合作伙伴能夠在未來達到更高的性能水平。DVS 還有助于在高度復雜的游戲場景中保持穩定幀率,同時為未來下一代的幾何內容提供支持。Immortalis-G720 有助于控制 HDR 渲染中使用的高深度紋理的性能影響。DVS 的引入意味著超復雜幾何形狀的場景可被渲染,并可節省處理能力。
Arm認為內存系統能耗功率是導致處理器散熱達到極限的主要因素。在第五代架構中,希望為 GPU 分配更多的內存系統效能以達到更好的視覺效果,同時也希望可以進一步節約能耗功率,以延長電池續航時間。
除了引入第五代架構外,Immortalis 和 Mali GPU 的整體設計在性能和效率方面也實現了大幅提升。Immortalis-G720 支持十核或更多核心,并可選用優化的物理 IP 來加速 SoC 設計。Mali-G720 和 Mali-G620 的超強可擴展性有助于為廣泛的消費電子設備帶來優質的圖形功能,例如智能手機、筆記本電腦、數字電視、機頂盒 (STB) 和可穿戴設備。Mali-G720 可支持六到九個核心,而 Mali-G620 可支持至多五個核心,可助力 Arm授權許可合作伙伴在更多市場中實現設計工作的快速復用。
3D 場景重建是一個關鍵的機器學習應用場景,可以在移動 GPU上渲染真實場景的新穎視圖。并且在該應用下,與 Immortalis-G715 相比,Immortalis-G720 的峰值性能提高了25%,占用的內存帶寬減少了22%。
開發者可利用 Unity ML-Agents插件在游戲和模擬中訓練智能代理。在 GDC 2023 上,Arm展示了在移動 SoC 上處理 100 個類似代理和復雜圖形的超強表現。
Arm通過廣泛的 GPU 工具和資源保持對游戲開發者的生態系統支持??蓮腁rm Mobile Studio免費下載多種解析、性能分析和調試工具,以幫助開發者優化其應用的性能和效率。
軟件優化不可或缺
以TCS23 中的軟件來看包括三大支柱,即性能、安全以及開發者的可訪問性。Arm 終端事業部生態系統及工程高級總監 Geraint North詳細解析了TCS23 軟件部分的提升。
機器學習是軟件工作中非常重要的部分,因此在 TCS23 中我們更新了軟件技術庫。比如 Arm NN 以及 Arm Compute Library (ACL),這些都是開源的軟件技術庫,開發者可以利用它來優化在 Armv9架構 CPU 和 GPU 上面機器學習的復雜性。
自 2023 年 1 月以來,Arm NN和 ACL 已經通過谷歌的 Google Play Store 在安卓系統上提供,而且已經有超過 1 億日活躍用戶。此外,到 2024 年,不管是Arm NN還是 ACL 都可以使用谷歌的移動平臺,意味著開發者能夠在可下載的項目,在默認狀態下更新到網絡最新的版本,同時意味著能在基于 Arm 架構上實現開發者獲得最高可能的機器學習的潛力。
多年以來,Arm一直在大量提供不斷優化中的Mali GPU,賦能開發者,為他們免費提供了強大的開發工具,從而能夠讓他們在基于 Mali GPU 上實現最佳效果的設計。同時Arm還與全球主要的游戲引擎工作室進行多年的合作,一起推動圖形技術的進步,并且以一種非常可擴展的方式實現產品的優化。
Arm 還為開發者提供豐富的培訓以及最佳實踐信息文件的分享,讓開發者可以在開始構建圖形時不斷去改善他們的創意。
除此之外,Arm 還為最新的工藝節點和庫優化了IP,并且利用其在 RTL 方面的專長配置物理 IP,以此在先進的技術上為基于Arm架構的產品設計、制造提供了優化的EDA流程與物理實現。
軟件越多越復雜,相對應漏洞也會增長,Arm 的內存標記擴展MTE 功能通過“鎖”和“密鑰”的設置避免內存安全漏洞。值得一提的是,TCS23是一個完全支持64位的集群,以利用完整的64位移動生態系統的優勢。
小結:
TCS23基于最新一代的Armv9.2 架構,同時基于全新的DynamIQ共享單元之上,帶來更多的可擴展性和更細致的電源控制模式,確??蛻粼谛枰臅r候可以獲得完整的性能和帶寬,在不需要的時候可以通過非常細的顆粒度去降低功率。
從Arm對TCS23的部署也能夠看到解決方案的靈活性和彈性,適用于智能手機、筆記本電腦等不同領域。與此同時,對于安全性、AI運算以及生態都進行大量優化和拓展。TCS23給廣大客戶提供了非常好的可擴展性,以期發揮架構帶來的更大優勢。
-
ARM
+關注
關注
134文章
9211瀏覽量
371133 -
移動設備
+關注
關注
0文章
509瀏覽量
54924
發布評論請先 登錄
相關推薦
Arm預測2025年芯片設計發展趨勢
Arm 技術預測:2025 年及未來的技術趨勢

ARM主板定制流程與成本

Arm成功將Arm KleidiAI軟件庫集成到騰訊自研的Angel 機器學習框架
ARM技術是什么?國內有哪些ARM廠家呢?一起來了解一下!
Arm加入OpenCloudOS操作系統開源社區
ARM處理器和CPU有什么區別
Arm宣布專為移動游戲設計的圖形優化方案
Arm預計未來五年將有1000億臺設備用于AI
一文讀懂RISC-V與ARM

評論