北京2023年8月7日 /美通社/ -- "多元算力時代下,大規模的異構服務器設備面臨多種處理器架構、多種設備協議、不同管理芯片兼容的系統化設計挑戰,管理固件也迎來新的變革。開源開放的OpenBMC,以創新的分層解耦軟件架構,兼容不同處理器架構、算力平臺和管理芯片,為多元算力基礎設施提供了開放靈活的運維管理解決方案,也將推動產業形成開放、標準的管理固件生態。"浪潮信息服務器產品線總經理趙帥。
全球數字經濟持續穩定增長,AIGC等創新技術應用對于算力帶來了巨大的需求,算力新基建成為推動數字經濟發展的核心支撐力和驅動力。據國際數據公司IDC、浪潮信息、清華大學全球產業研究院聯合發布的《2022—2023全球計算力指數評估報告》顯示,2022年,中國整體服務器市場規模保持6.9%的正增長,占全球市場比重達25%。其中,生成式AI計算市場規模將從2022年的8.2億美元驟增到2026年的109.9億美元,成為驅動互聯網、金融、教育、醫療和制造等行業未來創新發展的重要引擎。
在AIGC等應用的驅動下,服務器架構正在由CPU密集型轉向搭載GPU、FPGA、ASIC芯片的加速計算密集型,算力呈現出多元化的發展趨勢。處理器架構也呈現多元化,x86、ARM、Power、MIPS、RISC-V等處理器架構持續并存。多元算力時代下,數據中心為保障大規模服務器的可靠穩定運行,各類異構設備統一運維的挑戰日益凸顯。如何實現多處理器、多芯片設備高效、穩定運行,對服務器管理控制系統BMC (Baseboard Management Controller)固件的兼容性、精細度、定制化和快速迭代能力提出了一系列新的挑戰。
多元算力時代,服務器穩定可靠的"第一道防線"面臨全新挑戰
BMC是在服務器中嵌入的復雜而獨立SOC(System on Chip)系統,是互聯網、通信、金融等用戶數據中心集中運維管理IT設備的核心組件,對服務器安全可靠運行、遠程集中管理和控制部署至關重要。
BMC由BMC硬件和BMC固件兩大部分組成。在硬件上BMC是完整的計算機系統,包含嵌入式處理器、內存(DRAM)和存儲芯片(Flash),外圍集成豐富的物理通道,連接數百個傳感器、CPU、內存、磁盤、電源、網卡、GPU、RAID卡等各類組件,實現對服務器硬件的全方位掌控。在軟件上,BMC固件基于Linux內核構建強大的嵌入式操作系統,實現遠程控制、故障診斷、配置部署、固件升級等各類運維管理功能,數據中心管理平臺通過BMC固件提供的Redfish、IPMI、SNMP等API接口實現海量服務器遠程集中運維管理和批量部署。
BMC固件以往通常依賴IBV(Independent BMC Vendor,獨立BMC固件提供商)設計的閉源商業方案,但伴隨著數字化轉型的快速,算力成為數字經濟發展的關鍵要素,傳統的BMC研發在架構的兼容性、開發周期、創新性方面存在越來越多的的局限性:
架構落后,平臺兼容性差。算力基礎設施呈現多元化發展, x86、ARM、Power、MIPS、RISC-V等通用處理器平臺并存,同時GPU、FPGA、ASIC芯片等加速算力芯片百花齊放,傳統BMC固件架構落后,可擴展性差,無法快速適配兼容各類算力芯片。
代碼閉源,存在安全風險。由于代碼閉源,未經過用戶和廣泛的同行安全檢查,隱藏的安全漏洞無法及時識別;且受限于代碼封閉,數據中心用戶更先進的BMC固件安全策略無法應用。
開發周期長,問題處理慢。一方面,IBV Codebase代碼變更頻繁,已有功能、問題在產品迭代過程中延續性較差,版本穩定性也得不到保障,導致產品開發周期長;另一方面,BMC固件問題處理依賴于IBV響應速度,從用戶側反饋固件問題到問題處理完畢往往花幾個月的時間,時效性無法得到保證,影響客戶體驗。
生態封閉,阻礙固件技術創新。在多元算力飛速發展的背景下,面向特定應用場景的服務器研發,需要更多軟硬件一體化設計,用戶希望參與到管理固件開發中,但是傳統BMC固件受限于商業模式,代碼閉源,通常附帶嚴格的代碼許可使用協議,限制用戶對軟件的使用和分發,阻礙了固件技術創新。
OpenBMC勢不可擋,以開源開放加速融合多元算力的創新優勢
由于傳統BMC固件存在著諸多問題,且隨著數據中心的不斷壯大,運維需求越來越向精細化、定制化的趨勢發展,業界開始探索更加開放先進的BMC固件發展之路 -- OpenBMC順勢而生。OpenBMC是一個Linux基金會項目,其目標是為BMC生成一個可定制的開源固件堆棧,該堆棧可以在服務器、網絡交換機等設備上運行。OpenBMC使用Yocto、OpenEmbedded、systemd和D-Bus技術輕松構建定制的管理平臺,為x86、ARM和Power等多元架構服務器平臺提供統一上層接口,支撐企業、通信和云數據中心的管理服務。
首先,OpenBMC生態開放,已經吸引了處理器、加速芯片、部件、服務器等產業鏈上下游主流廠商積極參與貢獻社區,例如IBM、Intel、AMD、Ampere、NVIDIA、Aspeed、字節跳動、阿里巴巴、浪潮信息等,各廠商發揮各自優勢建立了成熟穩定的社區基礎代碼,并且能夠對代碼進行廣泛的評審、識別和修復安全漏洞,降低固件安全風險,為BMC固件技術創新營造了活躍的生態環境。目前,OpenBMC已經實現了一系列高級管理功能,包括遠程控制、H5KVM、VNC、虛擬媒體掛載、傳感器狀態監控、故障診斷、固件安全升級、PID散熱算法、MCTP、PLDM等功能,為系統可靠性、可用性和可維護性提供有力保障。
其次,OpenBMC應用了先進開放的軟件架構,基于分層解耦的軟件架構,功能模塊之間通過一致的系統總線接口協議進行交互,擴展性高,能夠實現靈活的模塊化開發,同一套OpenBMC固件代碼能夠同時兼容多種處理器平臺、多種算力芯片等關鍵部件,對于新增部件也能夠快速適配兼容,大幅縮短迭代周期,提升開發效率。
第三,OpenBMC代碼開源,服務器廠商和最終用戶可以基于成熟、創新的社區基礎代碼構建安全可靠的管理固件。同時,開源有利于固件開發模式創新和技術創新,面向特定大規模應用場景,服務器廠商與最終用戶進行聯合固件開發,利用可擴展的軟件架構開發創新功能模塊,快速滿足客戶自定義、個性化的創新管理需求。
最后,OpenBMC開源開放有助于推動管理固件標準化。OpenBMC提供標準化的管理功能和管理接口,例如社區緊跟Redfish、MCTP、PLDM等規范演進,提供標準化管理API接口,有助于用戶數據中心管理平臺統一對接各廠商服務器,提升運維管理兼容性和一致性。
OpenBMC經過近十年的發展已趨于成熟,Intel、IBM、Meta(原Facebook)和Google等創始成員已經將其應用到各自產品中,國內的互聯網、金融、通信、服務器、芯片等科技企業也正積極規劃基于OpenBMC的BMC固件解決方案,OpenBMC應用前景勢不可擋。
浪潮信息攜手社區伙伴,加速OpenBMC發展
OpenBMC社區生態建設離不開業界廣泛的參與和支持,作為開源技術的擁護者與重要貢獻者,浪潮信息積極擁抱OpenBMC。早在2017年,浪潮信息與IBM合作貢獻社區,并陸續完成多款主流服務器產品的OpenBMC適配。2022年,浪潮信息在OpenBMC社區開源代碼貢獻排名中保持全球第5位和中國第1位,共計貢獻代碼13000余行,參與社區代碼審核1000余次,廣泛覆蓋Redfish、PLDM、LED、USB升級、OCC、時間管理、電源控制等模塊,推動了社區的健康發展。
基于OpenBMC方案,浪潮信息構建起更加穩定可靠、更具擴展性且芯片級安全的開放架構通用服務器產品。以業內TOP級客戶的大規模數據中心為例,其服務器規模通常高達數萬或數十萬臺,由于需求多樣,各種服務器產品配置多達400余種,每年需迭代幾十次。浪潮信息通過分層解耦、模塊化設計的OpenBMC方案,在BMC層面實現了軟硬件的標準設計,支持服務器產品的快速、穩定迭代,從而更快、更好的滿足用戶資產信息管理、故障預警、遠程管理和批量自動部署等需求。
充分利用OpenBMC等開源技術賦能多元算力基礎設施建設,需要持續推動硬件、固件、軟件、系統等多方面的協同,強化處理器、部件、管理芯片、服務器、用戶各個層面的生態合作與聯合優化,從開源社區中汲取能量,從而引領開放計算技術產業化落地,助力數據中心高質量發展。
審核編輯 黃宇
-
服務器
+關注
關注
12文章
9129瀏覽量
85346 -
數據中心
+關注
關注
16文章
4764瀏覽量
72100 -
開源
+關注
關注
3文章
3323瀏覽量
42475 -
算力
+關注
關注
1文章
966瀏覽量
14796
發布評論請先 登錄
相關推薦
評論