電子發(fā)燒友網(wǎng)報道(文/黃晶晶)據(jù)預測,到2026年底中國道路上將有超過100萬輛搭載L3級別ADAS(高級駕駛輔助系統(tǒng))的汽車。到今年年底,中國將有超過1.7 億臺支持AI的智能手機,55% 的PC 將支持AI功能。同時,AI 數(shù)據(jù)中心將增長5倍。從這組數(shù)據(jù)中,我們已經(jīng)看到AI正在快速地推進眾多行業(yè)的智能化進程。當前首要任務是夯實AI底座,構(gòu)建一個強大的生態(tài)系統(tǒng),為AI應用打下堅實的根基,從而助力其實現(xiàn)指數(shù)級增長。
在最近舉辦的Arm Tech Symposia年度技術(shù)大會上,Arm終端事業(yè)部產(chǎn)品管理副總裁James McNiven表示,在過去的三十多年里,Arm一直致力于打造全球最大的計算平臺,并以無與倫比的能源效率著稱。憑借Arm的行業(yè)洞察和數(shù)十年與生態(tài)伙伴的合作,Arm的計算平臺正持續(xù)推動新一代生態(tài)系統(tǒng)合作伙伴關(guān)系的發(fā)展。正如 Arm 曾經(jīng)助力智能手機的崛起,Arm 也將成為AI計算平臺的驅(qū)動者。
圖:Arm終端事業(yè)部產(chǎn)品管理副總裁James McNiven
大會期間,James說道:“我們正面臨全新的需求,無論是算力、性能、能效,還是上市時間的需求都在不斷提升。”在談及Arm如何以超越硬件的設計方法助力AI應用時,James分享:“要想充分釋放 AI 的潛力,我們需要從系統(tǒng)層面思考問題,將硬件、軟件和生態(tài)無縫集成到一個全面的解決方案,使其具備卓越的可擴展性、性能和能效,并且能夠加速產(chǎn)品上市。”
以硬件為基石
Arm推出的計算子系統(tǒng) (CSS),正是為客戶提供優(yōu)化的解決方案,強大的軟件生態(tài)系統(tǒng),以及更快的上市時間。該解決方案主要聚焦于異構(gòu)計算并實現(xiàn)對系統(tǒng)多種計算要素的優(yōu)化協(xié)作,實現(xiàn)高效率的軟件編寫方式、易用且可擴展的全球解決方案,讓開發(fā)者能夠針對硬件進行開發(fā)。
James強調(diào),Arm多年來持續(xù)投資Armv9架構(gòu)。在過去幾年中,通過加入許多以 AI 為核心的功能,使該架構(gòu)適用于未來發(fā)展,而這一進程還在持續(xù)。十多年前,Arm首次將 AI 功能引入 Arm 架構(gòu),隨后在 Armv8 架構(gòu)中引入了64位技術(shù),但真正開啟AI時代的,則是 Armv9。
這其中包括兩大關(guān)鍵技術(shù),可伸縮向量擴展 (SVE)和可伸縮矩陣擴展 (SME)。
SVE2 已應用于一些領(lǐng)先的計算產(chǎn)品中,如全新的天璣 9400,可加速工作負載,惠及開發(fā)者和終端用戶。SVE2 提升了視頻和圖像處理,提供更好的照片質(zhì)量。
SME新一代架構(gòu)功能將為開發(fā)者提供通用指令集,使其能夠一次在多個硬件平臺上實現(xiàn) Arm 架構(gòu)中的加速效果。
James表示,未來十年的Arm計算平臺將持續(xù)為 AI 而優(yōu)化,所有功能將通過軟硬件能力的結(jié)合來實現(xiàn)。
以軟件為中心
在傳統(tǒng)的、AI 熱潮興起前的初創(chuàng)公司中,硬件和軟件工程師的比例大約是 50/50。但現(xiàn)在這一比例變成了 10/90,即10% 的硬件工程師和90%的軟件工程師。軟件的地位已經(jīng)壓倒性地提升,而圍繞軟件構(gòu)建的復雜性也在持續(xù)增長。
針對這一趨勢,James表示,Arm 聚焦于整體的技術(shù)棧,從底層硬件到整個技術(shù)棧中的軟件和應用程序。Arm已投入 30 多年來編寫和優(yōu)化軟件,軟件始終是 Arm 計算平臺不可或缺的一部分。未來技術(shù)將變得更加復雜,并且需要大量的支持。軟件的開發(fā)成本高且耗時,因此投資策略也必須不斷進化。
Arm相信我們正處于以軟件為中心的未來。目前已有2000萬名開發(fā)者在Arm平臺上進行軟件開發(fā)。受到如此多的開發(fā)者青睞,正是因為Arm 擁有全球最大的計算平臺,這形成了良性循環(huán),即更多的硬件吸引更多開發(fā)者開發(fā)軟件,進而推動對高能效硬件的需求,彼此互為循環(huán)。這一過程貫穿整個技術(shù)棧,從底層的操作系統(tǒng)到頂層的應用程序和用戶與科技的互動方式。一致的計算平臺為開發(fā)者提供了信心,使他們能夠編寫出可在當前數(shù)十億臺Arm 硬件上良好運行的軟件。
為了進一步以技術(shù)賦能開發(fā)者,Arm正在抽象化許多硬件相關(guān)的技術(shù)細節(jié),真正實現(xiàn)對開發(fā)者友善的設計,讓他們能專注于打造優(yōu)秀的軟件與簡單的整合。
其今年中旬發(fā)布的KleidiAI,是一款致力于提升人工智能計算性能的軟件庫,旨在通過與主流AI框架的深度集成,為開發(fā)者無縫獲取底層硬件架構(gòu)的高性能。目前KleidiAI已與PyTorch、TensorFlow和MediaPipe等熱門框架集成,能夠顯著優(yōu)化如Meta Llama 3和Phi-3等大型語言模型的性能。在本次年度大會上,Arm還宣布其與騰訊合作,通過 KleidiAI 集成提升混元大模型端側(cè) AI 性能,為騰訊眾多應用場景提供卓越的 AI 體驗。當與Arm終端CSS結(jié)合使用時,KleidiAI借助Neon、SVE2和SME2等技術(shù)實現(xiàn)了性能的顯著提升,特別是在生成式AI應用中的效率得到了極大的優(yōu)化。
James解析,Kleidi 技術(shù)可以用于加速Armv9 和Armv8 架構(gòu)。最初的版本實際上是覆蓋 Neon 指令集,而Arm陸續(xù)新增了 SVE (可伸縮向量擴展)、SVE2 和 SME (可伸縮矩陣擴展)等新架構(gòu)功能。因此,它將適用于多個不同版本的架構(gòu),包括 Armv8、Armv9.0,乃至目前最新的Armv9.2。
Kleidi 技術(shù)以其卓越的性能給人留下深刻印象,通過集成 Kleidi,騰訊混元大模型的預填充部分加速了 100%,而解碼器的速度提高了 10%。這些性能改善有助于實現(xiàn)更快、更高效的 AI 操作。其應用范圍從發(fā)布伊始的終端市場,已經(jīng)擴展到云端應用,例如在基于Arm架構(gòu)的 AWS Graviton 處理器上運行Llama 3 模型時,詞元 (token) 首次響應時間可提高2.5 倍。
在談及Kleidi未來的發(fā)展,James表示:“隨著 Kleidi 的逐步普及和更多開發(fā)者的參與,我們將看到更多的優(yōu)化。作為開源生態(tài)系統(tǒng)的一部分,我們期待開發(fā)者為其貢獻力量,從而在整個 Arm 生態(tài)系統(tǒng)中實現(xiàn)更廣泛的協(xié)作?!?br />
此外,在此次大會期間,Arm也展示了其對生態(tài)系統(tǒng)合作的重視。今年,Arm與vivo持續(xù)深化合作,宣布成立聯(lián)合實驗室,分別發(fā)揮各自在技術(shù)賦能和用戶理解領(lǐng)域的優(yōu)勢,為用戶帶來卓越的 AI 體驗,這成為Arm生態(tài)合作的一個優(yōu)秀范例。此外,Arm還與合作伙伴攜手,積極推進產(chǎn)業(yè)標準化進程,旨在構(gòu)建一個健康、可持續(xù)的Arm生態(tài)系統(tǒng)。James 表示,Arm正在思考如何打造一個軟件庫,通過將其集成到合作伙伴的軟件中,讓這些應用能夠在包括移動終端在內(nèi)的端側(cè)領(lǐng)域,充分發(fā)揮 Arm CPU 的性能優(yōu)勢。同時,Arm也將持續(xù)投入軟件,例如,在企業(yè)場景中提供支持,通過與 Linaro 的合作,持續(xù)強化對 Linux 的支持,在固件標準(如 UEFI)上的貢獻,以及對一些開源工具的支持等,盡可能減少產(chǎn)業(yè)的碎片化。
Arm加快AI PC進程
Arm正在加緊建設AI PC的相關(guān)生態(tài)。目前Windows on Arm 平臺已成功運行很多原生應用程序,并配備了豐富的開發(fā)工具,而且越來越多的創(chuàng)新應用正在涌現(xiàn),如愛奇藝、嗶哩嗶哩和搜狗等原生支持 Windows on Arm 的應用,可以充分利用AI PC的全部AI功能。未來,用戶將會看到更多、更加卓越的使用體驗。
Arm正與包括微軟在內(nèi)的多家合作伙伴攜手合作,繼續(xù)深化Arm的AI PC進程?,F(xiàn)在微軟已經(jīng)推出了專門針對Arm 架構(gòu)的 Windows 11 系統(tǒng)。談到業(yè)內(nèi)擔心的基于Arm 架構(gòu)運行時面臨的軟件兼容和生態(tài)問題,James解釋道:“我們持續(xù)和微軟合作,通過微軟提供的仿真環(huán)境,我們也為應用程序的開發(fā)者提供更多指引和建議。根據(jù)微軟的統(tǒng)計,其 PC 用戶投入在筆記本電腦上的時間,大約 90% 是用在原生應用上,表明了目前 WoA 原生應用的用戶體驗得到了顯著提升。”
小結(jié):
預計到2025年,將會有1,000億臺基于 Arm 架構(gòu)的設備可用于AI,這其中包括廣泛的面向邊緣 AI 的產(chǎn)品,從Arm Cortex-M到 Arm Cortex-A涵蓋了不同的性能水平和功耗需求。而Arm終端CSS、KleidiAI以及廣泛的生態(tài)合作,將助力開發(fā)者更方便快捷地釋放AI技術(shù)的潛力。
-
ARM
+關(guān)注
關(guān)注
134文章
9084瀏覽量
367382
發(fā)布評論請先 登錄
相關(guān)推薦
評論