無論是移動應用程序或數字商務等可見應用程序,還是航空公司定價算法或每次刷卡時激活的欺詐檢測系統等幕后流程,AI 都已成為我們日常生活中不可或缺的一部分。尤其是生成式 AI,預計未來十年將以兩位數的速度持續增長,到 2032 年市場規模可能達到1 萬億美元以上。
AI 技術的發展推動了對更強大的處理器的需求,尤其是 GPU,是構建 AI 基礎設施的重要組成部分。NVIDIA 在行業和市場占據著主導地位,AMD 也越來越受歡迎,但企業必須面對GPU 持續增加的功耗,部分型號甚至已經超過1kW,這一趨勢也導致全球數據中心功耗大幅增加。預計在 2022 年至 2026 年間還將翻一番,容量已然成為公共事業提供商和企業面臨的主要挑戰。
目前,大約80% 的數據中心運營商面臨功率限制,許多運營商對每機架功率限制在 10-20 kW的范圍內。雖然傳統方法證明,提高處理器性能和效率可以提高總功耗,但很多數據中心運營商已經達到功率上限,這也對企業的持續創新和增長造成了阻礙。此外,擴展機架空間或適應特殊的冷卻方法通常成本高昂或受到空間和法規的限制;老化的服務器基礎設施(許多服務器使用時間超過 5 年)也不斷增加維護成本和安全風險。
對此,最實用的解決方案是升級現有的基礎設施。及時的服務器更新能夠大幅整合機架空間,從而降低運營成本,回收電力預算,并支持部署能夠處理 AI 工作負載的現代服務器。在評估服務器更新時,運營商需要用新的方式來思考,只要新一代處理器的每瓦性能(即效率)提高,處理器功耗的增加就可以被接受,這意味著新服務器比舊服務器 “里程更長”。盡管最大機架功率預算有限并開始接近極限,通過專注于每機架的性能,企業可以優化現有的電力和空間,使他們能夠從數據中心的局限性轉為更加專注于業務的增長和創新。
Ampere 的云原生處理器旨在提供橫向擴展性能和領先的效率。AmpereOne 自研核是替代老舊服務器的最佳 CPU 選擇。在AmpereOne 效率白皮書中,詳細闡述了 AmpereOne 的效率優勢,相較 AMD EPYC 9004 系列處理器,如何使云原生和 AI 工作負載的每機架性能提高 67%。
以下是 7 個開源工作負載,從 Web 服務器和負載均衡器到數據庫,再到緩存和內存中數據存儲。它們在許多現代 Web 服務中頗受歡迎,因為它們通過緩存處理 web 流量管理、數據存儲和性能優化。
在AI 計算時代,通過將 AI 推理工作負載添加到上述通用工作負載中,可以增強各個行業的產品和服務。下表展示了 AmpereOne 在機架級別的性能和效率,適用于推理工作負載,如推薦引擎(DLRM)、圖像處理(ResNet-50)以及以語言為中心的工作負載(Whisper和Llama3)。這些工作負載支持現代設施,例如聊天機器人、在電子商務網站上查看推薦的產品、在流媒體平臺上呈現“您可能喜歡的節目”,或者為直播電視流提供實時隱藏字幕。
對于前面提到的每機架可用功率有限的企業和服務提供商來說,實現每機架的最大性能尤為重要。即使是中等規模的企業,由 AI 驅動的 web 服務也可以從 AmpereOne 中受益。與 AMD EPYC Genoa 8 個機架的輸出相比,AmpereOne 可以在不犧牲性能水平的情況下,將機架空間減少 38%,將功率預算降低 37%,并將購置成本降低 49%。以下代理 web 服務包括作為前端 Web 服務器的 NGINX、作為鍵值存儲的 Redis、作為內存數據庫的 Memcached、作為關系數據庫的 MySQL,以及分別作為推薦引擎和聊天機器人的 AI 組件 DLRM 和 Llama3。
AmpereOne 可以通過更新老化的服務器來重新利用預算、空間和功率。我們展示了如何節約資本支出,如何通過降低功耗和管理開銷而實現運營支出的節省,在三年內為企業節省大量 TCO。相較 AMD EPYC Bergamo,運營商可以節省 33% 的成本;與 AMD EPYC Genoa 相比,可節省高達 41% 的成本,這都歸功于AmpereOne。
無論公司規模大小,“AI 海嘯” 將繼續降低企業大規模實施 AI 的準入門檻。即使沒有資源去雇傭專門的 AI 團隊,企業也可以通過服務提供商來開啟 AI 之旅,并迅速投入生產。因此,整合傳統基礎設施為 AI 擴展釋放空間尤其重要。
-
處理器
+關注
關注
68文章
19312瀏覽量
230033 -
AI
+關注
關注
87文章
30996瀏覽量
269286
發布評論請先 登錄
相關推薦
評論