電子發燒友網報道(文/吳子鵬)6月13日,在2022阿里云峰會上,阿里云智能總裁、阿里巴巴達摩院院長張建鋒表示,阿里云今年最重要策略是“Back to Basic”,回到云計算的本質,堅持技術長征。
阿里云智能總裁、阿里巴巴達摩院院長張建鋒
圖源:阿里云
圍繞這一核心主題,張建鋒詳細介紹阿里云新一代云數據中心處理器CIPU,以及與其相關聯的飛天操作系統、神龍計算層架構等等。
圖源:阿里云
專為云數據中心打造的CIPU
從CIPU的名字來看,大家都有一種很熟悉的感覺,因為它和處理器CPU僅僅只有一個字母“I”的差別。但實際上,CIPU和CPU有明顯的不同,CIPU是Cloud Infrastructure Processing Units的簡稱,中文釋義為云基礎設施處理器,是為新型云數據中心設計的專用處理器。
當然,CIPU和CPU也有一層深層的關系,CIPU在云數據中心領域是CPU的替代者,成為新的算力引擎。
我們先看一下CIPU提出的背景,傳統數據中心以CPU為核心進行打造,經過歷年來的不斷優化,這種方式已經觸及到了天花板,在性能、功耗和時延等方面有著明顯的瓶頸限制。與此同時,數據中心在需求端的明顯變化進一步放大了這一短板,數據密集型的計算需求不斷涌現,低時延和高帶寬都是必要的參數配置,而滿足這些需求的前提是更加低碳環保。
此外,目前全球都在規模性部署超大型數據中心。根據市場調研公司Synergy Research Group的數據分析,目前全球擁有314個超大型數據中心,未來3年的時間內將增加到1000個。張建鋒指出,基于CPU為中心的架構無法解決超大規模的復雜管理問題。
作為CPU在云數據中心領域的繼任者,張建鋒介紹稱CIPU主要有以下幾點重要特性:
?網絡:對高帶寬物理網絡進行硬件加速,通過建設大規模的eRDMA分布式高性能網絡,實現RDMA技術的普惠化;
?存儲:對存算分離架構的塊存儲接入進行硬件加速,提供超高性能的云盤;
?計算:快速接入不同類型資源的神龍計算平臺,帶來算力的“0”損耗,以及硬件級安全的加固隔離。
上面更多是質變的描述,我們看一下量變的情況。根據張建鋒的介紹,CIPU在主流通用計算場景下,Nginx性能提升了89%,Redis性能提升了68%、MySQL提升了60%;大數據和AI 場景下,AI深度學習場景訓練性能提升30%,Spark計算性能提升30%。
在存儲方面,CIPU存儲時延最低可至30us(PLX),IOPS高達300萬,存儲帶寬可達200 Gbps,全面超越市面上所有云產品。
在網路傳輸方面,CIPU基礎帶寬從100G升級至200G,VPC的PPS轉發性能從2000萬提升至4000萬,網絡時延從22us降低至16us,RDMA協議下更可低至5.5us。
阿里云CIPU性能參數,圖源:阿里云
更需要特別指出的是,CIPU并不是一個獨立的高性能硬件,而是一個硬件基礎,它可對計算資源進行云化加速,并可部署飛天操作系統對云資源進行管控。和阿里云當前的飛天架構和神龍架構結合,都能夠迸發出1+1大于2的效果。
阿里云的軟硬件一體化布局
當前,全球數據中心的發展已經步入新階段,數據中心的構建和對算力的需求都發生了巨大的變化,傳統通用處理器已經越來越難以滿足這些情況變化。我們看到,不僅僅是阿里云,各個大型數據中心運營商都在致力于自研專用處理器,配合自家的架構體系,以求在功耗、時延和性能等方面打造最佳的平衡。
近幾年阿里云在軟硬件方面持續投入,收獲頗豐,并逐漸實現自家軟硬件的深度融合。
回顧2021阿里云峰會,阿里云宣布,飛天操作系統正在全面兼容X86、ARM、RISC-V等多種芯片架構,實現“一云多芯”。按照阿里云的描述,“一云多芯”的實現讓阿里云成為全球支持CPU種類最多的云廠商。
隨后2021阿里云棲大會上,阿里云又發布首款通用芯片倚天710,采用最新ARMv9架構,多達128核,主頻最高3.2GHz,可同時兼顧性能和功耗,適配云的不同應用場景。2022年4月,基于倚天710的公共云 ECS實例已上線邀測。硬件方面,阿里云還在去年發布了自研的磐久服務器。
而為了能夠最大化釋放這些硬件的潛能,阿里云在云數據中心部署各個關鍵節點都發布了自研的基礎架構和核心平臺。為解決服務器長久以來的虛擬化性能損耗的問題,阿里云在計算層推出了自研的神龍架構,神龍與CIPU結合,可將虛擬化轉移到專用硬件中進行加速,可將物理機的高性能與虛擬機的靈活性融為一體,虛擬化損耗幾乎為零,并帶來更強勁的性能表現;為提升存儲傳輸速度、安全防護和容災能力等,阿里云在存儲層推出了自研的盤古架構,是阿里云底層的統一存儲架構,采用了分布式系統先進的容錯架構和柔性平臺設計,具備彈性伸縮、自動負載均衡等能力,大幅提高了存儲系統的可靠性和安全性,可支持塊存儲、對象存儲、表格存儲、文件存儲、離線大數據處理等多種存儲模式;為了實現“讓網絡更簡單”的理念,阿里云推出自研的洛神核心技術平臺,支撐起百萬級的用戶業務部署,讓更多能夠人體驗到云計算帶來的高效便捷服務,2021云棲大會上,阿里云更新推出了洛神云網絡3.0新平臺架構。
在軟硬件如此多元化和大范圍的投入,阿里云的目的是在提供更好算力支持的情況下,打造更加綠色的數據中心。根據Supermicro發布的《數據中心與環境2021綠色數據中心現狀分析報告》,目前全球數據中心已占全球發電總量近3%,預計到2030年將快速增加到8%,也有可能接近一成。
張建鋒表示,阿里云是國內最早實踐綠色數據中心的廠商之一,目前阿里云自建的數據中心都已達到國家綠色數據中心標準,全年平均PUE小于1.3。
-
云計算
+關注
關注
39文章
7833瀏覽量
137480 -
數據中心
+關注
關注
16文章
4791瀏覽量
72168 -
阿里云
+關注
關注
3文章
958瀏覽量
43079
發布評論請先 登錄
相關推薦
評論