當今移動設備上的大多數人工智能 (AI) 工作負載均可在 Arm CPU 上運行。在智能手機領域,基于 Armv9 CPU 技術構建的 AI 旗艦智能手機立于技術前沿,其中包括搭載 MediaTek 天璣 9300 芯片的 vivo X100 和 X100 Pro 智能手機、三星 Galaxy S24 以及 Google Pixel 8,為 AI 創新提供了前所未有的機遇。
隨著 AI 工作負載的計算強度及復雜度持續增長,Arm 最新的 Armv9.2 CPU 集群帶來更強性能、更高效率,以及更多功能,為新一代 AI 奠定扎實基礎。這些優勢可擴展到包括旗艦智能手機、AI PC,以及主流移動設備、XR 和可穿戴設備等在內的各類消費電子設備,彰顯了我們致力于實現無處不在的 AI 所作的努力。
新增至 Armv9 CPU 組合的新品包括具備超強性能的 Arm Cortex-X925 CPU 和可持續提供出色性能的 Arm Cortex-A725 CPU,而更新后的 Arm Cortex-A520 可為低強度工作負載提供更卓越的能效表現。與此同時,我們也更新了 DynamIQ Shared Unit (DSU-120),從而在 Armv9.2 CPU 集群配置中,降低功耗和縮小面積。這些產品被集成至 Arm 迄今為止針對安卓系統速度最快的計算平臺 —— 新的 Arm 終端計算子系統 (CSS)。
圖:Armv9 CPU 系列的新產品及更新
Cortex-X925 實現了最顯著的 Cortex-X 性能提升
Cortex-X925(內部代號為 Blackhawk)與此前的 Cortex-X 產品相比,實現了最高的同比性能提升,重新定義了計算性能的發展軌跡。Cortex-X925 的單線程(峰值)性能提高了 36%(與 2023 年高端安卓手機上運行 Geekbench 6.2 相比),并且其 AI 性能提升了 46%(與前代 Cortex-X4 CPU 上的 Phi-3 詞元首次響應時間相比)。
圖:Arm Cortex-X925 性能提升
Cortex-X925 的功耗性能配置意味著它能在關鍵時刻提供峰值性能。這有助于提高跨應用、生成式 AI 工作負載、網頁瀏覽、攝像頭后處理、視頻錄制和 AAA 游戲的響應能力,進而帶來更優異的用戶體驗。
這些性能提升得益于 Cortex-X925 出眾的性能基礎及其開創性的新微架構。Cortex-X925 通過經優化的三納米工藝,輔以卓越的子系統和封裝,使得新一代消費電子設備的性能分數可提高 30% 以上。包括高達 3MB 的私有 L2 緩存在內的微架構改進,提供了更強的 CPU 集群可配置性,讓各類消費電子設備的創新成為可能。
作為 Arm 終端 CSS的一部分,我們協同設計并交付了 CPU 物理實現。我們攜手領先的代工廠合作伙伴,實現了流片就緒的 Cortex-X925 三納米工藝的物理實現,助力我們的合作伙伴能夠在三納米工藝上充分發揮功耗、性能和面積 (PPA) 優勢,同時通過大批量生產就緒的芯片解決方案來縮短芯片的開發與部署進程。
Cortex-A725 持續提供出色性能
Arm Cortex-A700 系列 CPU 的出色性能效率一脈相承,Cortex-A725 也不例外。作為 CPU 工作負載的主力,我們的工程和設計團隊就 Cortex-A725 進行了針對性更新,著力于需要持續出色性能的關鍵 AI 和游戲用例。與 Cortex-A720 相比,Cortex-A725 的性能效率提升了 35%,能效提升了 25%。
圖:Arm Cortex-A725 性能和能效提升
Cortex-A725 的性能效率提升同樣得益于其微架構的改進。和 Cortex-X925 一樣,通過 Arm 先進的物理實現,我們在三納米工藝上優化了 Cortex-A725 的實現。我們還可為主流消費技術市場提供面積優化的實現。
Cortex-A520 和 DSU-120 的更新
Cortex-A520 已針對 Arm 終端 CSS進行更新,從而提供更為出色的能效,與 2023 Arm 全面計算解決方案 (TCS23) 中的 Cortex-A520 相比,其效率提升了 15%。Cortex-A520 的更新得益于更新的實現與先進的三納米物理實現。
圖:更新后的 Arm Cortex-A520
作為新的 Arm 終端 CSS 的一部分,DSU-120 已針對新一代用例和消費電子設備體驗進行了強化。其中包括新的性能和效率功能、新的低功耗模式和面向主流消費電子設備的強化,并保留了為高性能用例擴展到 14 個核心的選項。得益于此,典型工作負載的功耗顯著降低 50%,并且整個 CPU 集群的緩存未命中功耗降低 60%,從而減少漏電并延長設備的電池壽命。新的低功耗模式(例如 half slice power down 和 quick nap)和增強功能支持大量低強度和高強度的 AI 工作負載,包括生物特征識別、語音轉文本、AI 智能攝像頭、內容創建和基于機器學習 (ML) 的 AAA 游戲。
圖:DSU-120 更新和提升
Arm 性能最強、效率最高、用途最廣泛的 CPU 集群
這些新推出和更新后的 CPU 構成了 Arm CPU 集群配置,為廣泛的消費電子設備提供前所未有的性能、效率和廣泛用途。概括地說,與采用上一代 Cortex-X4 的 CPU 集群相比,新的 CPU 集群的 AI 性能提高了 46%,能實現了更高的響應性能和持續的吞吐量。與 TCS23 CPU 集群相比,它使關鍵用戶體驗指標(結合性能與功耗)提高 30%,進而加快應用訪問和網頁瀏覽速度,提升 AAA 游戲體驗,并延長電池使用壽命。
最新的 Arm CPU 集群還可為各類的消費電子設備提供出色的擴展能力。例如,它為 PC 和筆記本電腦提供一流的性能,與當前發售的 PC 和筆記本電腦設備相比,性能提高了 25%。同時,與 TCS23 中的 DSU-120 相比,功耗和面積均獲得降低,加上通過 Cortex-A725 和 Cortex-A520 帶來的面積和功耗優化,為主流設備提供了靈活的 CPU 集群配置組合。這有助于在各類低成本的消費電子設備上提供優異性能和 AI 功能,確保日常設備用戶能夠獲得高級的 AI 體驗。
Armv9 CPU 面向新一代 AI 體驗
新的 Armv9.2 CPU 集群為安卓智能手機、PC 和筆記本電腦等設備提供出色的性能與用戶體驗。該集群提供一整套實際用例的改進,集群中各個 CPU 組件均涵蓋廣泛的實際用例和工作負載。例如,Cortex-X925 可處理應用啟動和網頁瀏覽的“突發”工作負載,Cortex-A725 可提供常見 AI 工作負載和 AAA 游戲所需的持續性能,Cortex-A520 的高效率則非常適合輕量型媒體和閑置及后臺任務。所有這些增強的實際用例體驗都可以擴展到各類消費技術領域,新推出的 Armv9 CPU 為主流設備和日常用戶帶來了更高的性能和更強大的 AI 功能,從而使關鍵用戶體驗指標提高 30%。
隨著用戶在其設備上花費的時間不斷增多,并期望獲得更高級的體驗,消費者對技術的需求永無止境。無論是更快的網頁瀏覽和應用訪問速度,還是增強的 AAA 游戲與生成式 AI 工作負載,新的 Armv9 CPU 通過先進的計算功能提升各類體驗,進而定義消費技術的未來。
-
攝像頭
+關注
關注
59文章
4836瀏覽量
95599 -
移動設備
+關注
關注
0文章
493瀏覽量
54688 -
人工智能
+關注
關注
1791文章
47183瀏覽量
238253 -
生成式AI
+關注
關注
0文章
502瀏覽量
471
原文標題:新的 Armv9 CPU 加速 AI 在移動設備等領域的發展
文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論