液冷NVIDIA A100 PCIe GPU能夠滿足客戶對(duì)高性能綠色數(shù)據(jù)中心的需求,在主流服務(wù)器GPU中尚屬首例。
為了遏制氣候變化,全球企業(yè)正在加快構(gòu)建高性能、高能效的數(shù)據(jù)中心,Equinix邊緣基礎(chǔ)設(shè)施主管Zac Smith也參與其中。
他所效力的Equinix是一家全球服務(wù)提供商,旗下管理的數(shù)據(jù)中心超過(guò)240個(gè),致力于在業(yè)內(nèi)率先實(shí)現(xiàn)氣候中和。
“一萬(wàn)家客戶依賴Equinix達(dá)成氣候中和的目標(biāo)。他們需要更大量的數(shù)據(jù)以及更高水平的智能,而這通常有賴于AI,且他們希望能夠以一種具有可持續(xù)性的方式來(lái)實(shí)現(xiàn)。”Smith說(shuō)道。2000年代初還在茱莉亞音樂(lè)學(xué)院讀研的他,為紐約的音樂(lè)家同僚們搭建了網(wǎng)站,由此與技術(shù)結(jié)下不解之緣。
能效穩(wěn)步提升
截至4月,Equinix已發(fā)行49億美元的綠色債券。Equinix將通過(guò)這些投資工具來(lái)優(yōu)化電源使用效率(PUE),以期減少對(duì)環(huán)境的影響。PUE是一種行業(yè)指標(biāo),用于衡量數(shù)據(jù)中心使用的能源有多少直接用于計(jì)算任務(wù)。
數(shù)據(jù)中心運(yùn)營(yíng)商正試圖將PUE降至接近1.0的理想水平。Equinix設(shè)施目前的平均PUE為1.48,而其旗下新數(shù)據(jù)中心的PUE最低可低于1.2。
從PUE來(lái)看,Equinix正在穩(wěn)步提升數(shù)據(jù)中心的能效
Equinix于1月新啟動(dòng)了一個(gè)專門用于提升能效的設(shè)施,在此方向上更進(jìn)一步。其中一部分工作側(cè)重于液冷技術(shù)。
液冷技術(shù)誕生于大型機(jī)時(shí)代,在AI時(shí)代日臻成熟。如今,液冷技術(shù)已經(jīng)以直接芯片(Direct-to-Chip)冷卻的形式廣泛應(yīng)用于全球高速超級(jí)計(jì)算機(jī)。
NVIDIA GPU在AI推理和高性能計(jì)算方面的能效已比CPU高出20倍,而加速計(jì)算也順理成章地將采用液冷技術(shù)。
通過(guò)加速提高效率
如果將全球所有運(yùn)行AI和HPC的CPU服務(wù)器切換為GPU加速系統(tǒng),每年可節(jié)省高達(dá)11萬(wàn)億瓦時(shí)的能源。節(jié)約的能源量可供150多萬(wàn)套房屋使用一年。
今日,NVIDIA發(fā)布了率先采用直接芯片(Direct-to-Chip)冷卻技術(shù)的數(shù)據(jù)中心PCIe GPU,為可持續(xù)發(fā)展貢獻(xiàn)了自己的力量。
Equinix正在驗(yàn)證A100 80GB PCIe液冷GPU在其數(shù)據(jù)中心的應(yīng)用,這也是該公司為實(shí)現(xiàn)可持續(xù)性冷卻和熱量捕獲的綜合性方案中的一部分。GPU現(xiàn)已進(jìn)入試用階段,預(yù)計(jì)將于今年夏季正式發(fā)布。
節(jié)約用水和用電
“這是我們實(shí)驗(yàn)室中引入的首款液冷GPU,我們倍感興奮,因?yàn)榭蛻羝惹邢Mㄟ^(guò)可持續(xù)的方式來(lái)利用AI,”Smith說(shuō)道。
數(shù)據(jù)中心運(yùn)營(yíng)商旨在淘汰用于冷卻數(shù)據(jù)中心內(nèi)部氣體的冷水機(jī)組,因其每年會(huì)蒸發(fā)數(shù)百萬(wàn)加侖的水量。而借助液冷技術(shù),系統(tǒng)僅需對(duì)封閉系統(tǒng)中的少量液體進(jìn)行循環(huán)利用,并能夠著重于主要的發(fā)熱點(diǎn)。
Smith說(shuō):“我們將變廢為寶。”
同等性能,更少耗電
在單獨(dú)的測(cè)試中,Equinix和NVIDIA均發(fā)現(xiàn):采用液冷技術(shù)的數(shù)據(jù)中心工作負(fù)載可與風(fēng)冷設(shè)施持平,同時(shí)消耗的能源減少了約30%。NVIDIA估計(jì),液冷數(shù)據(jù)中心的PUE可能達(dá)到1.15,遠(yuǎn)低于風(fēng)冷的PUE 1.6。
在空間相同的條件下,液冷數(shù)據(jù)中心可以實(shí)現(xiàn)雙倍的計(jì)算量。這是由于A100 GPU僅使用一個(gè)PCIe插槽,而風(fēng)冷A100 GPU需使用兩個(gè)PCIe插槽。
NVIDIA借助液冷技術(shù)達(dá)到了節(jié)省電力和增加密度的效果
至少有十幾家系統(tǒng)制造商計(jì)劃于今年晚些時(shí)候在其產(chǎn)品中使用液冷GPU,包括華碩(ASUS)、永擎電子(ASRock Rack)、富士康工業(yè)互聯(lián)網(wǎng)(Foxconn Industrial Internet)、技嘉科技(GIGABYTE)、新華三(H3C)、浪潮(Inspur)、英業(yè)達(dá)(Inventec)、寧暢(Nettrix)、云達(dá)科技(QCT)、超微(Supermicro)、緯穎科技(Wiwynn)和超聚變(xFusion)。
全球趨勢(shì)
在亞洲、歐洲和美國(guó),制定能效標(biāo)準(zhǔn)的法規(guī)尚未確定。這也推動(dòng)了銀行和其他大型數(shù)據(jù)中心運(yùn)營(yíng)商紛紛加入液冷技術(shù)評(píng)估的隊(duì)伍。
液冷技術(shù)的使用范圍并不局限于數(shù)據(jù)中心,汽車和其他系統(tǒng)也需要利用該項(xiàng)技術(shù)來(lái)冷卻封閉空間內(nèi)的高性能系統(tǒng)。
可持續(xù)發(fā)展之路
“我們即將開(kāi)啟新的旅程,”Smith談及這一采用液冷技術(shù)的主流加速器首次亮相時(shí)如是說(shuō)。
事實(shí)上,NVIDIA計(jì)劃于明年推出的一版A100 PCIe卡中搭載基于NVIDIA Hopper架構(gòu)的H100 Tensor Core GPU。近期內(nèi),NVIDIA計(jì)劃將液冷技術(shù)應(yīng)用于自有高性能數(shù)據(jù)中心GPU和NVIDIA HGX平臺(tái)。
為推動(dòng)快速采用,今日發(fā)布的液冷GPU可在減少能耗的同時(shí)維持性能不變。未來(lái),我們期望這些卡在使用同等能源的條件下,展現(xiàn)更出色的性能,滿足用戶所需。
“僅僅測(cè)量功率沒(méi)有意義,降低碳排放的同時(shí)提升性能才是我們努力的方向,” Smith說(shuō)道。
詳細(xì)了解NVIDIA全新發(fā)布的A100 PCIe液冷GPU。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5013瀏覽量
103246 -
gpu
+關(guān)注
關(guān)注
28文章
4752瀏覽量
129057 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9231瀏覽量
85625
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論