在歐洲和美國(guó),HPC 開(kāi)發(fā)者正在利用 NVIDIA BlueField-2 DPU 內(nèi)的 Arm 核和加速器的強(qiáng)大功能為超級(jí)計(jì)算機(jī)提供強(qiáng)大助力。
美國(guó)洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室 (LANL) 正在與 NVIDIA 進(jìn)行一項(xiàng)為期多年的廣泛合作,這項(xiàng)合作旨在將計(jì)算型多物理應(yīng)用的性能提高 30 倍。
LANL 研究人員預(yù)計(jì),使用在 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)上運(yùn)行的 DPU(數(shù)據(jù)處理器)可顯著提升性能。這將使利用 BlueField 以及NVIDIA DOCA 軟件框架在計(jì)算存儲(chǔ)、模式匹配等領(lǐng)域?qū)崿F(xiàn)技術(shù)創(chuàng)新。
面向 DPU 的開(kāi)放式 API
這些努力還將有助于進(jìn)一步定義 OpenSNAPI,任何人都可通過(guò)該應(yīng)用接口來(lái)控制 DPU。這是統(tǒng)計(jì)計(jì)算框架( Unified Communication Framework) 的一個(gè)項(xiàng)目,Unified Communication Framework 是一個(gè)旨在實(shí)現(xiàn) HPC 應(yīng)用異構(gòu)計(jì)算的聯(lián)盟,成員包括 Arm、IBM、NVIDIA、美國(guó)國(guó)家實(shí)驗(yàn)室和美國(guó)的一些大學(xué)。
LANL 已經(jīng)感受到網(wǎng)絡(luò)計(jì)算的強(qiáng)大功能,這要?dú)w功于其創(chuàng)建的 DPU 賦能的存儲(chǔ)系統(tǒng)。
加速閃存盒(ABoF,如下圖所示)將固態(tài)存儲(chǔ)與 DPU 和 InfiniBand 加速器相結(jié)合,可為 Linux 文件系統(tǒng)的關(guān)鍵性能部分提供加速。它的性能高達(dá)同類(lèi)存儲(chǔ)系統(tǒng)的 30 倍,并將成為 LANL 基礎(chǔ)架構(gòu)中的關(guān)鍵組件。
一位研究人員在近期的 LANL 博客中表示:“ABoF 讓計(jì)算靠近存儲(chǔ),可更大限度減少數(shù)據(jù)移動(dòng),從而提高仿真和數(shù)據(jù)分析工作流程的效率?!?br />
德克薩斯州打造出云原生超級(jí)計(jì)算平臺(tái)
德克薩斯高級(jí)計(jì)算中心 (TACC) 近期也開(kāi)始在 Dell PowerEdge 服務(wù)器中采用 BlueField-2。它將在 InfiniBand 網(wǎng)絡(luò)上使用 DPU,使其 Lonestar6 系統(tǒng)成為云原生超級(jí)計(jì)算的開(kāi)發(fā)平臺(tái)。
TACC 的 Lonestar6 為德州農(nóng)工大學(xué)、德州理工大學(xué)和北德克薩斯大學(xué)的眾多 HPC 開(kāi)發(fā)者,以及一些研究中心和教職人員提供服務(wù)。
MPI 獲得加速
在距 TACC 東北部 1200 英里的地方,俄亥俄州立大學(xué)的研究人員展示了 DPU 如何將一個(gè) HPC 熱門(mén)編程模型的運(yùn)行速度提高 26%。
他們通過(guò)卸載消息傳遞接口 (MPI) 的關(guān)鍵部分,加速了 P3DFFT,這是一個(gè)用于眾多大規(guī)模 HPC 仿真的數(shù)學(xué)庫(kù)。
俄亥俄州立大學(xué)計(jì)算機(jī)科學(xué)與工程專(zhuān)業(yè)的教授 Dhabaleswar K. (DK) Panda 在其帶領(lǐng)的 MVAPICH 開(kāi)源軟件團(tuán)隊(duì)推動(dòng) DPU 工作,他表示:“DPU 就像是為忙碌的高管處理工作的助手,它們將成為主流,因?yàn)樗鼈兛梢约铀龠\(yùn)行各種工作負(fù)載。”
HPC 中心和云中的 DPU
對(duì)于運(yùn)行藥物研發(fā)或飛機(jī)設(shè)計(jì)等 HPC 仿真應(yīng)用的超級(jí)計(jì)算機(jī)而言,高達(dá)兩位數(shù)的性能加速是驚人的。Panda 表示,云服務(wù)可以利用這些加速提高客戶(hù)的生產(chǎn)力,他已收到多個(gè) HPC 中心的代碼請(qǐng)求。
Quantum InfiniBand 網(wǎng)絡(luò)以及 NVIDIA SHARP 特性,助力他高效完成工作。
他說(shuō):“其他人還在談?wù)摼W(wǎng)絡(luò)計(jì)算,而 InfiniBand 已經(jīng)在為它提供支持?!?br />
達(dá)勒姆開(kāi)發(fā)負(fù)載均衡
歐洲的多個(gè)研究團(tuán)隊(duì)正利用 BlueField DPU 加速 MPI 和其他 HPC 工作負(fù)載。
例如,英格蘭北部的達(dá)勒姆大學(xué)正在開(kāi)發(fā)一款軟件,用于在 16 個(gè)節(jié)點(diǎn)的 Dell PowerEdge 集群上使用 BlueField DPU 以實(shí)現(xiàn) MPI 作業(yè)的負(fù)載均衡。該項(xiàng)目的首席調(diào)查員 Tobias Weinzierl 表示,該軟件將為全球各地的 HPC 設(shè)施更高效地處理更好算法鋪平道路。
劍橋大學(xué)和慕尼黑的 DPU 應(yīng)用
劍橋大學(xué)、倫敦和慕尼黑的研究人員也在使用 DPU。
倫敦大學(xué)學(xué)院正在探索如何在 BlueField-2 DPU 上為主機(jī)系統(tǒng)調(diào)度作業(yè)。例如,可以使用它的能力在主機(jī)處理器之間移動(dòng)數(shù)據(jù),以便在需要時(shí)數(shù)據(jù)已然就位。
Dell PowerEdge 服務(wù)器內(nèi)的 BlueField DPU 可為 Cambridge Service for Data Driven Discovery 服務(wù)卸載主機(jī) CPU 的安全策略、存儲(chǔ)框架和其他作業(yè),從而更大限度地提高系統(tǒng)性能。
與此同時(shí),慕尼黑工業(yè)大學(xué)計(jì)算機(jī)體系架構(gòu)和并行系統(tǒng)組的研究人員正在尋找方法,使用 DPU 來(lái)卸載 MPI 和操作系統(tǒng)任務(wù),這是 EuroHPC 項(xiàng)目的一部分。
在美國(guó),佐治亞理工學(xué)院的研究人員正在與桑迪亞國(guó)家實(shí)驗(yàn)室合作,利用 BlueField-2 DPU 加速分子動(dòng)力學(xué)研究。一篇論文描述了他們目前的工作成果,其中表明,算法可以加速高達(dá) 20%,且不會(huì)損失模擬的準(zhǔn)確性。
NVIDIA BlueField DPU極大推動(dòng)了全球超級(jí)計(jì)算中心的發(fā)展,我們看到了加速計(jì)算未來(lái)的無(wú)限可能。
不斷擴(kuò)展的網(wǎng)絡(luò)
本月早些時(shí)候,日本研究人員宣布將推出一款采用新版 NVIDIA H100 Tensor Core GPU 的系統(tǒng),該系統(tǒng)將搭載速度更快、更智能的 NVIDIA Quantum-2 InfiniBand 網(wǎng)絡(luò)平臺(tái)。
NEC 將使用 H100 的為筑波大學(xué)計(jì)算科學(xué)中心構(gòu)建算力大約為 6 PFLOPS 超級(jí)計(jì)算機(jī)。研究人員將使用該系統(tǒng)實(shí)現(xiàn)氣候?qū)W、天體物理學(xué)、大數(shù)據(jù)、AI 和更多方面的研究。
與此同時(shí),Panda 等研究人員已經(jīng)開(kāi)始考慮如何使用 BlueField-3 DPU 的核心功能。
他打趣道:“這就像雇傭擁有大學(xué)學(xué)位的行政助理,而不是那些擁有高中文憑的行政助理一樣,所以我希望能夠完成越來(lái)越多的工作卸載。”
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5025瀏覽量
103267 -
DPU
+關(guān)注
關(guān)注
0文章
365瀏覽量
24215
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論