提起山東,大家第一時間想到的可能是五岳之首泰山。《詩經》有云,泰山巖巖,魯邦所瞻,形容的就是泰山令人高山仰止的巍峨。時移事易,到了2022年,以“算賦百業 力導未來”為主題的首屆中國算力大會在山東濟南召開,全國計算領域人士聚在一起,看到的則是一座頂天立地的算力高山——國家超級計算濟南中心,成為新的齊魯地標。
濟南市作為“中國算谷”,國家超級計算濟南中心是其算力支撐機構之一,我國首臺完全采用自主處理器研制的千萬億次超級計算機“神威·藍光”,就誕生于此。
以前,大部分人都很關心算力發展,而國家超級計算濟南中心的實踐說明,數據存力更是算力價值的前提和基礎,發揮算力價值之前,首先要構建“數據存力”。國家超級計算濟南中心不僅是算力巔峰,還是存力標桿,比如目前已經在山河超級計算集群中落地了分布式存儲創新架構。
20世紀50年代,馮諾伊曼在《101頁報告》中提出了計算機的核心:存儲、計算、控制,奠定了現代計算機的體系結構。從此,算力和存力作為兩大高相關資源,其協同發展成為計算產業繞不開的主題。以新加坡、日本、加拿大等國為例,每1GB存儲空間對應的算力可達1GFlops,存力和算力相對均衡。國家超級計算濟南中心的山河超級計算集群,能夠提供超850PFlops的算力,總的存儲資源池目前也達到了245PB規模。
如果說算力支撐著千行百業計算需求,那么存力就是容納吞吐著澎湃算力的乾坤。國家超級計算濟南中心,給了我們一個契機,在東數西算工程正式啟動的元年,去探尋存算協同發展的答案:數字經濟所需要的算力應該由怎樣的存力來承載?而算力與存力的協同發展,究竟能給國家重大科研和經濟發展帶來哪些不可替代的貢獻?
道法自然:頂天立地的超算中心
了解國家超級計算濟南中心需要怎樣的存力,首先需要知道它承載了怎樣的計算。
《史記集解》記載,泰山“天高不可及,冀近神靈也”,國家超級計算濟南中心所承擔的計算任務,也有著類似的高水平,主要是解決其他計算機解決不了的挑戰性問題,有著“頂天立地”的作用。
國家科研領域,超算中心服務于國家重大科研需求,主要應用于生物計算、氣候模擬、類腦研究、災害預報、新藥研發、基因研究、航空航天、自動駕駛等領域,這些研究的特征之一就是數據密集,對于算力的需求十分龐大。以國家超級計算濟南中心的山河超級計算平臺為例:該平臺服務于山東省大科學計劃與大科學工程,為新一代信息技術、現代海洋、新能源新材料、高端裝備、醫養健康等產業提供算力支撐,要求性能高、算得快。
國計民生領域,超算中心的算力應用涉及國計民生、科技創新,是支撐產業轉型升級的戰略性基礎設施,因此,在滿足國家科研任務對性能的巔峰要求之外,超算中心還要兼顧成本普惠、綠色低功耗等需求,支撐數字經濟浪潮中層出不窮的應用創新與計算需求。國家超級計算濟南中心就有多個計算平臺,承載著關乎國計民生的眾多應用,對區域科研水平提高和數字經濟發展,發揮著重要價值。
從 “頂天立地”的趨勢中不難看出,超算中心已經成為衡量國家綜合實力的標準之一,也是各國科技戰略的必爭之地。以對自然環境和生態的模擬、基礎物理和生命科學等問題求解為己任的國家超級計算中心,自然也需要與之相匹配的存儲能力,包括:底層技術的自主創新、靈活擴展的存儲容量、高效吞吐的存儲效率等。
國家超級計算中心作為存力的最佳試驗場,濟南已經率先邁出了探索的步伐。
吐納天地:存力中見數字乾坤
算力作為生產力,支撐社會經濟的數字化轉型升級,而存力作為數據地基,在每一次吐故納新之中,助力數字經濟行穩致遠。數據存力不僅以存儲容量為核心,還包含性能表現、安全可靠、綠色低碳在內的綜合能力。數據存力成為數字經濟背景下,全社會全產業發展的重要指標。
那么,國家超級計算中心究竟需要怎樣的存力呢?國家超級計算濟南中心總工程師王繼彬在此次大會“以‘數’踐行,創新存儲架構護航超算科技創新”的主題演講中指出,濟南超算率先落地應用了創新的分布式存儲架構,已經有一些經過驗證的關鍵指標:
一、安全可靠。作為國家的戰略性基礎設施,國家超級計算中心的安全可靠有兩層含義,一是底層技術的安全可靠,在新的國際形勢下,國家超級計算濟南中心承載著眾多科研任務,尤其需要存儲領域的原創技術,如材料介質、高性能處理器等的系統創新,守護數據基石;二是日常運行中的安全可靠,要求良好的容災能力,在各類風險,比如自然災害、網絡襲擊、人為失誤等情況下,仍然保持業務不斷,數據不丟。
濟南中心所承載的國家對地觀測科學數據中心,每天需要對TB級的實時衛星數據進行集中存儲和計算,過程中不允許中斷,珍貴數據長期存儲不能丟失。濟南超算基于分布式存儲構建的數據存儲系統,能夠做到7*24小時業務不中斷,跨節點保護數據安全,很好地支撐了這一高可靠需求。
二、性能表現。大科學領域HPC應用對存力的容量和效率提出了更高要求,一方面,科學計算的數據規模龐大,需要的存儲容量也越大,1臺基因測序儀每年產生的數據可達8.5PB,需要超前規劃、靈活擴容,比如濟南超算的山河超級計算平臺,作為服務山東省大科學計劃與大科學工程的重大科學裝置,總存儲資源池就達到了245PB;另一方面,科學計算的存算數據交互頻繁,計算任務長,應用負載多元化,訪存空間不規則,對存儲系統的吞吐性能要求很高。因此,濟南超算與華為合作,基于華為OceanStor Pacific分布式高性能并行存儲,實現了業內1.3倍的性能提升,在IO500 10節點打榜中獲得全球第一的榜單成績。數據存得下、流得動,是存力的基礎指標,為科學計算發揮支撐作用。
三、統一管理。隨著數據應用場景增多、AI技術的成熟,智能計算、云平臺等新業務成為主流,因此需要多個計算平臺針對不同應用輸出不同算力。面對異構計算和多樣化應用,傳統超算中心多個計算集群部署多套存儲的方式容易遭遇瓶頸,比如海量數據在不同的資源池中,會形成數據孤島,給協同分析、價值挖掘帶來阻礙。因此,濟南超算基于分布式存儲,構建了統一數據底座,率先打造出山東省超算互聯數據一張圖。通過全局統一的數據視圖和管理策略,實現不同集群之間的多協議互通,讓數據能夠跨域、跨集群、跨設備共享與流動,從而助力科學計算的數據價值挖掘與協同分析,加速科技創新。比如山河超級計算平臺,就實現了文件、對象和大數據融合存儲以及數據的跨域流動。
基于分布式存儲創新架構,國家超級計算濟南中心聯合合作伙伴,完成了一系列關于存力的實踐探索,展現出存力與科學計算、數字經濟相結合的意義。可以肯定的是,超算中心的頂天立地,靠的不是算力的一枝獨秀,而是算力與存力的協同發展。
筑基未來:雙輪驅動使能數字經濟
聽起來,超算中心主要服務于高精尖科研,那么濟南超算的存力實踐,對普通人來說有意義嗎?中國有句話叫“已識乾坤大,猶憐草木青”,存力不僅能包羅容納科學世界的壯闊,同樣也是支撐著每一個人、每一個企業、每一座城市的數字底座,隨著數字經濟的騰飛,滋養我們習以為常的日常生活、一草一木。
舉個例子,大家應該都了解“東數西算”工程的價值,全國算力一張網的逐漸落成,將切實帶來產業升級、生活提升、經濟發展,讓東西部居民都為之受益。而濟南超算的分布式存儲架構創新實踐,對于方興未艾的東數西算工程就有著極為重要的參考意義。
我們知道,“東數西算”工程旨在構建一個集數據中心、云計算和大數據于一體的新型國家計算網絡,這張算力資源網絡的本質是以數載算,通過數據流通、分析和消費,讓算力轉化為GDP產值和社會民生的優化。而數據能否存得下、存得好、流得動、高能效,都取決于存力。
而東西部數據中心間的數據流動,就有一系列問題是需要通過存力提升來解決的:
比如前面提到濟南超算不同計算集群中的數據孤島問題,在東西部的數據流動時也同樣存在。通過分布式存儲,實現跨域數據安全高效流動和共享,能夠提高東西部的數據利用率和協同效率,讓算力更充分地發揮GDP帶動作用。
再比如,全國算力一張網形成之后,數據卻是散落在各處的,如果沒有跨地域統一的元數據管理,則無法支撐東西部并行分析,數據存儲能效比不高,算力基礎設施也就無法取得最大效益。這時候濟南超算所落地的統一元數據管理等經驗,存力一張網結合算力一張網等技術,將使得管理效率大大提升。
存力和算力,是數字經濟高質量發展的一體兩面,隨著超算互聯網和“東數西算”工程的持續推進,存力升級必將成為數字基礎設施的演進方向。
國家超級計算濟南中心率先打開錦囊,進入了數據驅動第四范式的全新階段。不難發現,無論高精尖的科研創新,還是接地氣的民生福祉,都藏在存力這個吐納天地的“乾坤袋”中。
接下來,我們將看到中國科技在算力與存力的雙輪驅動下,不斷鼎革天地。
-
超級計算
+關注
關注
1文章
39瀏覽量
11275 -
算力
+關注
關注
1文章
965瀏覽量
14794 -
存力
+關注
關注
0文章
23瀏覽量
80
發布評論請先 登錄
相關推薦
評論