浪潮云海秉承開放兼容、分層解耦的技術理念,面向全行業用戶提供領先的私有云產品與解決方案,助力企業構建堅實云基座,實現數字化重構與轉型。在金融領域的云原生和云計算建設過程中,浪潮云海積累了豐富的實踐經驗,憑借創新務實的實干理念,以客戶需求為核心的服務意識,得到了行業和客戶的廣泛認可。
本文系浪潮數據云計算方案總監劉健演講實錄,以下內容將從云計算的發展趨勢、金融云的趨勢及挑戰、浪潮云海在云原生基礎設施建設過程中的實踐成果三部分進行相關經驗的分享和觀點的探討。
一、云計算發展趨勢:下一代云數據中心
目前,AI、5G、大數據這些詞匯已和云計算密不可分,在這樣的環境下,浪潮云海認為開放硬件、開放軟件以及軟硬件分層解耦已成為數據中心發展的重要趨勢,同時,面對更為多樣的計算場景,云計算體系架構的演進、模型即服務、多元算力的管理能力也成為下一代云數據中心的進化方向。
軟硬件同步優化
為滿足用戶對產品性能和使用體驗的需求,在倡導軟硬解耦的基礎上,浪潮云海同樣關注軟硬件的同步優化。在云計算領域,通過對硬件的深度優化,可大幅提升產品性能,以此解決軟件層容器和虛擬化的損耗問題;通過DPU改變底層的高可用架構,從而實現虛擬機高可用的邏輯切換。
廣泛的軟硬件協同
計算系統架構的解耦和計算設備之間的互操作性是未來計算可持續發展的關鍵。在網絡層面,硬件SDN和網絡設備極易綁定,在解耦的階段,通過云上軟SDN和任意廠商網絡設備,配合GPU和智能網卡加速,就可以做到解除綁定和性能提升;在存儲系統層面,也可以通過同樣的辦法實現存儲系統的加速;在安全層面,以DPU做加強,可實現計算機系統負荷的卸載。以上都是通過硬件優化來實現軟件的性能提速。
模型即基礎設施
隨著ChatGPT的持續火熱,模型已經和算力、算法一樣,成為了下一代云的基礎設施標準。但從歸屬劃分上看,公有云上訓練得到的模型仍屬于公有云,只有在私有云上基于自己的數據進行訓練,才能得到專屬的大模型,這也是國內大型金融機構目前致力發展的方向。
多元算力
支撐新興業務發展,助力多元算力場景。現在的數據中心從物理資源層上看基礎設施更加多元,X86和ARM設備的混部已成為常態;用戶對算力引擎的需求也囊括了虛擬化、裸機、容器,且這一狀態將長期持續;算力類型上也從單純的CPU向GPU、FPGA擴展。
二、金融云趨勢及挑戰
金融云發展趨勢
金融云發展大致可分為三個階段:IOE時代、業務云化時代、云原生時代。云原生能力又可概括為以下三點:應用的容器化,服務的Mesh化及Serverless。金融IT本質上是為組織和業務服務的,所以上層技術的變化往往源于組織架構的變遷。業務架構從單體、到服務化再到微服務架構,數據架構從統計分析到數據服務湖倉一體,技術架構對應發展到服務網格,最終形成組織架構和開發框架的變革。每個階段組織架構和技術架構都需要匹配,這是一個逐步演進的過程。
金融云建設挑戰
IaaS層的建設經驗較為通用,但是PaaS層的建設則更加復雜,對此我們做出以下分析:
IaaS和PaaS都有明顯的行業屬性,如果一個云廠商賣給所有客戶的PaaS都是一樣的,則它是不具備行業屬性的。每個行業的業務不同,要求的PaaS指標和組件也不同,標準化產品未必適用。
容器即服務,很多場景下用戶認為PaaS不好用、不靈活是因為廠商將PaaS的基礎設施跟PaaS的服務整合在了一起,極端情況可能是每個產品都附帶了容器平臺。對此,浪潮云海的建設經驗是把PaaS的功能解耦出來,使之成為容器即服務。
在業務層的搭建過程中,我們建議用戶建設一個統一的云基礎設施,并選擇業務可解耦的PaaS廠商,將解耦后的能力架設在統一的容器即服務平臺上。
微服務體系的建設也存在多架構并存和逐步演進的過程:在微服務框架里面,Dubbo和SpringCloud是目前較為流行的應用分布式、微服務開發框架,在金融行業應用廣泛;而Istio目前的發展趨勢則是平臺級別的服務治理框架,可進行無侵入的遺留系統微服務改造。當然,微服務架構的選擇和平臺規劃、公司規劃是密不可分的,同時也需要逐步去演進。
對于微服務的運維,我們建議將IaaS層和PaaS層打通,形成垂直運維體系。這里面臨如下挑戰:PaaS組件版本、開發框架多,不同的PaaS組件有不同的硬件資源,導致部署效率低;在業務數據網絡隔離的情況下,如何解決PaaS的跨域使用。對此我們建議在網絡分區的情況下,根據使用環境需求按需部署、按需編排,并構建統一發放的網絡,把中間運維側打通,通過運維網絡將PaaS發放到不同的域里面去,通過就近部署、就近訪問,統一運維,實現PaaS層的統一。
三、浪潮云海云原生基礎設施創新與實踐
目前,浪潮云海主要著力于建設云原生基礎設施的底層,參考信通院發布的《云原生能力成熟度標準》,聚焦兩個方向來開展工作:第一,技術架構,主要是資源管理、運維保障、研發測試等;第二,業務應用,主要是彈性、高可用、自動化、可觀測等。
"一云多芯+云原生"
在金融云的建設實踐中,"一云多芯"是金融行業云的一項重要的基礎指標。一云多芯"可滿足用戶算力多樣化需求,并且可有效規避算力孤島;是打破小生態、構建大生態的關鍵紐帶; 并且可有效降低供應鏈風險 。無論是從業務角度、技術角度,還是產業鏈角度,踐行"一云多芯"已經成為當下及未來云計算產業發展的關鍵,是產業鏈相關廠商的必然選擇,現在,能源、電力行業也對一云多芯提出了明確的要求。
浪潮云海認為"一云多芯+云原生"是解決算力異構的最優解,我們根據無狀態和有狀態兩種業務形態總結出以下實踐經驗:
對于無狀態應用,基本都基于Java開發,編譯過程并不難,重新編譯后的應用,都能運行在多芯集群里,對底層CPU或服務器并無太多限制;
對于有狀態的數據,最重要的是保障數據庫數據無丟失,不一定要追求一云多芯。但可以進行相關嘗試,如在一云多芯環境中部署分布式數據庫,可以用X86算力支撐primary集群或寫操作,用非X86算力承載standby或者讀操作,這是數據庫一云多芯的一種實現方式。這種模式也可以應用在數據庫層面的容災建設中。
除了考慮業務形態,我們在實踐過程中還總結了以下幾個建設要點:
集群內的算力自動等價調度:因為不同架構服務器之間有算力的換算問題;對此,我們聯合信通院及多家廠商,進行過算力自動等價調度測試;
流量切換:在實踐中可通過網關切換來實現;
無感切換:目前我們的產品已經具備這種能力,用戶底層基礎設施的架構并不會影響上層業務運行,用戶可基于不同架構的底層資源進行動態的調整和資源的調用。
微服務架構體系的建設
對于微服務架構體系的建設,如上提到,首先是開發框架的并存問題。對此,我們建議通過配置中心將各架構統管起來,先把共性的東西抽離出來,再進一步做融合。其次是多數據中心的問題,目前用戶普遍都有多套數據中心,對此,可以通過級連的方式做管理,用總分總的模式進行管理。
高可用設計
下一代云的高可用設計在云原生層面不難實現,但并不是所有業務都是云原生的,這就使得難以從上層解決高可用的問題。作為基礎設施廠商,我們提倡通過底層建設,即使不依賴云原生也能實現高可用。所以對于下一代的高可用架構,我們希望可以在這兩個維度上來回切換,同時也希望能打通裸機和虛擬機的控制平面,實現多引擎間的高可用。這其中還有很多挑戰,仍需逐步演進。
目前浪潮云海已經服務了15000多家客戶,在各個行業全面開花,涵蓋金融、能源、交通、醫療、企業、教育等關鍵領域,是客戶數字化、智慧化轉型的重要云底座。這其中包括國內最大規模的金融生產云,承載客戶的雙11業務;最大規模、芯片種類最多的省級政務云,承載4套公共應用服務,104個業務系統;以及汽車、軌交、科學計算實驗室等多個千萬級大項目。
審核編輯:湯梓紅
-
云計算
+關注
關注
39文章
7774瀏覽量
137355 -
浪潮
+關注
關注
1文章
458瀏覽量
23851 -
5G
+關注
關注
1354文章
48436瀏覽量
563969
發布評論請先 登錄
相關推薦
評論