在线观看精品视频一区二区三区,四虎网址大全,一级做a爱过程免费视频超级

近年來，人工智能相關技術在社會發展中扮演著日漸重要的角色。特別是在廣告、影視等多個行業，AIGC將內容生產效率提升數倍甚至數十倍，降低人力成本50%以上，是推動企業數字化轉型的關鍵動力。然而，在AI技術快速發展和相關應用迅速增長的同時，其背后的數據基礎設施也面臨嚴峻的考驗。

在諸如大規模訓練數據加載、PB級檢查點斷點續訓（其中，檢查點相關開銷平均可占訓練總時間的12%，甚至高達43%）和高并發推理問答等場景下，存儲系統的性能直接關乎整個訓練與推理過程中GPU的有效利用率。特別在萬卡集群規模下，存儲性能的不足會顯著增加GPU閑置時間，導致計算資源浪費——存儲系統1小時的開銷，在千卡集群中就意味著將浪費1000卡時，進而造成業務成本劇增。因此，在AI場景中，存儲已超越了傳統“數據容器”的范疇，轉變為支撐AI發展的核心組件。要加快數據價值釋放，推動AI產業化向產業AI化發展，提升存儲系統的性能至關重要。

如果把計算節點比作數據工廠，存儲介質則相當于數據倉庫。提升存儲性能，意味著用戶能夠在同一時間內通過“存儲高速”在“數據工廠”和“數據倉庫”之間更高效地存取“數據物料”。

那么，要實現“數據物料”的快速運輸，可以從哪些方向入手呢？

其一，減少中轉站--數控分離。通過軟件層面的創新，將控制面（數據工廠）和數據面（介質倉庫）分離，減少數據中轉，縮短傳輸路徑，提升存儲單節點及集群的整體性能。

其二，增加車道數--硬件升級。硬件層面采用新一代的高性能硬件，通過DDR5和PCIe5.0等，升級存儲帶寬，增加傳輸通道數量，提升存儲性能的上限。

其三，物料就近存儲--軟硬協同。在軟硬協同層面，基于數控分離架構，自主控制數據頁緩存（儲備倉）分配策略，靈活調度內核數據移動，數據就近獲取，從而實現快速I/O。

接下來，我們將一一介紹這三大性能提升手段背后的實現原理及其主要價值。

軟件優化

數控分離，降低80%節點間數據轉發量

在傳統分布式文件系統中，數據和元數據高度耦合，導致數據讀寫信息的分發、傳輸和元數據處理都需要經過主存儲節點。在AI應用場景下，隨著客戶端數量激增和帶寬需求擴大，CPU、內存、硬盤和網絡I/O的處理能力面臨嚴峻考驗。盡管數控一體的分布式文件系統在穩定性方面表現優異，但在面對AI訓練等大I/O、高帶寬需求時，其性能瓶頸逐漸顯現。數據需通過主節點在集群內部進行轉發，這不僅占用了大量的CPU、內存、帶寬和網絡資源，還導致了數據傳輸的延遲。

為解決該問題，業界曾嘗試通過RDMA技術來提升存儲帶寬。RDMA允許外部設備繞過CPU和操作系統直接訪問內存，從而降低了數據傳輸延遲并減輕了CPU負載，進而提升了網絡通信效率。然而，這種方式并未從根本上解決數據中轉帶來的延遲問題。

基于此背景，浪潮信息采用全新數控分離架構，將文件系統的數據面和控制面完全解耦。控制面主要負責管理數據的屬性信息，如位置、大小等，通過優化邏輯控制和數據管理算法來提高存儲系統的訪問效率和數據一致性。而數據面則直接負責數據的讀寫操作，消除了中間環節的數據處理延遲，從而縮短了“數據物料”的存取時間。

這種數控分離的方式顯著減少了數據流在節點間的轉發次數，降低80%的東西向（節點間）數據轉發量，充分發揮硬盤帶寬，特別是全閃存儲性能。以浪潮信息分布式存儲平臺AS13000G7為例，在相同配置下，相比于單一TCP和單一RDMA方案，數控分離架構能夠帶來60%讀帶寬提升和110%寫帶寬提升。

硬件升級

拓寬傳輸通路，實現存儲性能翻倍

在AI應用場景下，“數據物料”的快速運輸依賴于高效的“存儲高速”通道。隨著CPU、內存、硬盤等硬件技術的不斷創新，升級“存儲高速”通道的硬件成為提升存儲性能的重要途徑。

浪潮信息分布式存儲平臺AS13000G7采用業界最新高端處理器芯片，如Intel第五代志強可拓展處理器，單顆最大支持60核，支持Intel 最新2.0版本睿頻加速技術、超線程技術以及高級矢量拓展指令集512（AVX-512)。同時，支持DDR5內存，如三星、海力士的32G、64G高性能、大容量內存，單根內存在1DPC1情況下，可以支持5600MHz頻率，相比與DDR4的3200MHz的內存，性能提升75%。

基于最新處理器的硬件平臺，AS13000G7已經支持PCIe5.0標準，并在此基礎上支持了NVDIA最新的CX7系列400G IB卡及浪潮信息自研PCIe5.0 NVMe。相較于上一代AS13000G6的PCIe4.0的I/O帶寬，實現帶寬提升100%。

在設計上，G7一代硬件平臺將硬件模塊化設計理念最大化，將處理器的I/O全部扇出，采用線纜、轉接卡等標準設計，實現配置的靈活性。最大可支持4張PCIe5.0 X16的FHHL卡，所有后端的SSD設備均通過直連實現，取消了AS13000G6 的PCIe Switch設計，從而消除了數據鏈路上的瓶頸點。前端IO的性能及后端IO的理論性能均提升了4倍。

為測試性能表現，浪潮信息將兩種軟件棧分別部署在兩代硬件上并進行讀寫測試。結果顯示，與上一代硬件平臺相比，在不同軟件棧上AS13000G7的性能可提升170%-220%，有效保障了AI應用場景下的存儲性能。

軟硬協同

內核親和力調度，內存訪問效率提升4倍

在當前的AI基礎設施平臺中，計算服務器配置非常高，更高性能的CPU和更多的插槽數帶來了NUMA（Non-Uniform Memory Access）節點數據的增加。在NUMA架構中，系統內存被劃分為多個區域，每個區域屬于一塊特定的NUMA節點，每個節點都有自己的本地內存。因此，每個處理器訪問本地內存的速度遠快于訪問其他節點內存的速度。

然而，在多核處理器環境下，會產生大量的跨NUMA遠端訪問。在分布式存儲系統中，由于IO請求會經過用戶態、內核態和遠端存儲集群，中間頻繁的上下文切換會帶來內存訪問延遲。如下圖，在未經過NUMA均衡的存儲系統中，存儲的緩存空間集中在單個NUMA節點內存內。當IO請求量增大時，所有其他NUMA節點的CPU核的數據訪問均集中在單個Socket內，造成了大量跨Socket 、跨NUMA訪問。這不僅導致了CPU核的超負荷運載和大量閑置，還使得不同Socket上的內存帶寬嚴重不均衡，單次遠端NUMA節點訪問造成的微小時延累積將進一步增大整體時延，導致存儲系統聚合帶寬嚴重下降。

為了降低跨NUMA訪問帶來的時延，浪潮信息通過內核親和力調度技術，在全新數控分離架構下，使內核客戶端可自主控制數據頁緩存分配策略并主動接管用戶下發的IO任務。這種方式能夠更加靈活地實現各類客戶端內核態到遠端存儲池的數據移動策略。其中，針對不同的IO線程進行NUMA感知優化，將業務讀線程與數據自動分配到相同的NUMA節點上，這樣，所有數據均在本地NUMA內存命中，有效減少了高并發下NUMA節點間數據傳輸，降低了IO鏈路時延，4倍提升內存訪問效率，保證負載均衡。

浪潮信息分布式存儲平臺AS13000G7通過一系列創新技術，顯著提升了數據處理效率，在最新發布的AI存儲基準評測MLPerf中取得8項測試的5項性能全球第一，實現集群帶寬360GB/s、單節點帶寬達120GB/s，在滿足AI場景下的高性能存儲需求方面展現出了卓越的能力，為大規模數據處理和AI應用提供了堅實的基礎。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

gpu

gpu

+關注

關注
28

文章
4729

瀏覽量
128890
人工智能

人工智能

+關注

關注
1791

文章
47183

瀏覽量
238245
分布式存儲

分布式存儲

+關注

關注
4

文章
171

瀏覽量
19523

原文標題：AI存儲理想之選！浪潮信息分布式存儲平臺AS13000G7性能飛躍新高度

文章出處：【微信號：inspurstorage，微信公眾號：浪潮存儲】歡迎添加關注！文章轉載請注明出處。

浪潮布局存儲平臺戰略，發布新一代G5存儲平臺

在存儲平臺戰略下，本次發布的新一代G5存儲平臺——浪潮數據中心級

發表于 03-30 09:25 ?868次閱讀

浪潮存儲刷新分布式存儲性能全球最高成績

日前，存儲性能委員會（Storage Performance Council，簡稱SPC）公布最新的 SPC-1 基準評測報告，浪潮分布式存儲

發表于 08-12 10:27 ?4202次閱讀

浪潮信息以新一代存儲核心構建新一代集中式和分布式存儲平臺

隨著數字化轉型的持續深入,各行業用戶面臨的數據存儲挑戰也與日俱增。在此背景下,浪潮信息基于“存儲即平臺”戰略,以新一代G6

發表于 12-06 12:22 ?3216次閱讀

浪潮信息發布新一代G6全閃分布式存儲

分布式存儲全球前三、中國第一的浪潮存儲，本次會上推出了新一代G6全閃分布式

發表于 04-19 09:42 ?1647次閱讀

獲得權威認可！浪潮存儲通過兩項可信云分布式存儲評測

近日，中國信息通信研究院公布可信云分布式存儲評測結果。浪潮存儲憑借AS13000

發表于 02-06 11:29 ?1753次閱讀

融合互通，浪潮分布式融合存儲AS13000加速海量數據處理

智慧時代，數據量激增且非結構化數據的占比逐漸增大，數據類型愈發復雜，處理數據的方式更加多樣化，傳統單一存儲難以滿足市場需求。基于此，浪潮推出了非結構化數據融合互通新平臺分布式融合

發表于 06-07 10:57 ?696次閱讀

浪潮信息澎湃認證：浪潮分布式存儲攜手博雅云OneSRM SMP存儲管理平臺完成兼容性認證

近日，博雅云OneSRM SMP存儲管理平臺與浪潮分布式存儲AS13000系列產品完成并通過

發表于 07-12 09:15 ?609次閱讀

一圖讀懂浪潮信息新一代分布式全閃存儲AS13000G7-N系列

一圖讀懂浪潮信息新一代分布式全閃存儲AS13000G7-N系列

發表于 05-08 09:35 ?1267次閱讀

浪潮信息發布為大模型專門優化的分布式全閃存儲AS13000G7-N系列

近日，浪潮信息發布為大模型專門優化的分布式全閃存儲AS13000G7-N系列。該系列依托浪潮信息自研分布

發表于 05-08 09:38 ?554次閱讀

為大模型專門優化 浪潮信息發布分布式全閃存儲AS13000G7-N系列

北京2024年5月10日?/美通社/ -- 近日，浪潮信息發布為大模型專門優化的分布式全閃存儲AS13000G7-N系列。該系列依托浪潮信息

發表于 05-10 16:37 ?428次閱讀

浪潮信息發布AS13000G7-N系列分布式全閃存儲

浪潮信息近日推出了專為大型AI模型優化的AS13000G7-N系列分布式全閃存儲。該系列基于浪潮信息自研的

發表于 05-14 10:03 ?562次閱讀

浪潮信息分布式存儲AS13000完成英特爾至強6能效核處理器適配

近日，浪潮信息分布式存儲AS13000完成英特爾至強6能效核處理器適配，實現每瓦性能提升2.3倍，以更高的效率、更優的成本滿足海量多態數據的

發表于 06-19 10:05 ?845次閱讀

浪潮信息推出基于新一代分布式存儲平臺AS13000G7的AIGC存儲解決方案

6月28日，浪潮信息“元腦中國行”全國巡展杭州站順利舉行。會上，浪潮信息重磅推出基于新一代分布式存儲平臺

發表于 07-01 19:00 ?1425次閱讀

浪潮信息推出AIGC存儲解決方案

隆重推出了基于其新一代分布式存儲平臺AS13000G7的AIGC存儲解決方案，這一創新成果無疑為當前大模型應用面臨的

發表于 07-03 11:16 ?713次閱讀

浪潮信息AS13000G7榮獲MLPerf? AI存儲基準測試五項性能全球第一

北京2024年9月27日?/美通社/ -- 9月25日，MLCommons協會發布最新MLPerf? Storage v1.0 AI存儲基準測試成績。浪潮信息分布式存儲

發表于 09-28 16:46 ?204次閱讀