英偉達 | GTC2022| 高性能計算
NVIDIA | RTX4090 |液冷服務(wù)器
在東數(shù)西算、生命科學(xué)、遙感測繪、地質(zhì)勘探、真空羽流、冷凍電鏡等技術(shù)的快速發(fā)展下,高性能計算的發(fā)展逐漸被人們所重視。GTC 2022會上指出高性能計算是推動科學(xué)發(fā)展的關(guān)鍵工具之一。
昨天GeForce RTX 4090顯卡正式公布,是全新GeForce RTX 40系列的旗艦產(chǎn)品,也是全球首款基于全新NVIDIA Ada Lovelace架構(gòu)。與上一代采用DLSS 2的RTX 3090 Ti相比,采用DLSS 3的RTX 4090的性能提升可達4倍。RTX 4090具有760億個晶體管、16384個CUDA 核心和 24GB 高速美光 GDDR6X 顯存。
本文將從英偉達為何在高性能計算中處于不敗地位、高性能計算發(fā)展趨勢、以及高性能計算解決方案為大家解讀。
高端GPU
英偉達獨角戲?
作為通用計算的“加速神器”--——高端GPU正在成為大型數(shù)據(jù)中心、人工智能、超算等領(lǐng)域的剛需。英偉達在高端GPU市場長期占據(jù)主導(dǎo)地位,市場份額一度超過90%。目前國內(nèi)企業(yè)要突破英偉達等國外公司的壟斷還有很長的路要走。而國內(nèi)基于架構(gòu)創(chuàng)新的DSA(針對特定領(lǐng)域的可編程處理器)芯片產(chǎn)品日益豐富,可能會帶來一些曙光。
高端GPU與傳統(tǒng)GPU“涇渭分明”
傳統(tǒng)GPU聚焦圖像學(xué),關(guān)注幀數(shù)、渲染逼真度、對于真實場景的映射程度等指標(biāo),主要用于運行游戲、專業(yè)圖像處理、加密貨幣處理等場景。而高端GPU是用于計算加速的芯片產(chǎn)品,專注于基礎(chǔ)科學(xué)等超算領(lǐng)域和訓(xùn)練、推理等大規(guī)模人工智能計算場景。
衡量高端GPU的主要維度是通用性、易用性和高性能。通用硬件架構(gòu)應(yīng)該足夠靈活,以適應(yīng)人工智能的迭代算法和場景。易用性是指開發(fā)門檻更低,開發(fā)者更容易上手,結(jié)合實際場景進行定制化開發(fā)。高性能是指芯片產(chǎn)品的基本性能和性價比必須達到國際先進水平,才能進行市場開拓。
2022年第二季度獨立GPU市場(包括AIB 合作伙伴顯卡)份額
來源:Jon Peddie Research
算力往往是市場對GPU性能優(yōu)劣的“第一印象”。但高端GPU的性能不等于紙面性能,尤其不能用單一性能的紙面數(shù)據(jù)來衡量。
在實際使用的過程中,GPU的通用性、易用性、實際性的重要程度遠大于紙面標(biāo)出的算力這一單一性能。紙面指標(biāo)標(biāo)得再高,也要關(guān)注內(nèi)存和帶寬夠不夠,以及芯片之間的互聯(lián)等問題解決得好不好。用單一性能來衡量GPU是否高端,是一個常見的誤區(qū)。
高性能計算將是主要“競技場”
長期以來,英偉達一直主導(dǎo)著高端GPU市場,市場份額超過90%,尤其是在人工智能計算領(lǐng)域。到目前為止,英偉達已經(jīng)推出Volta、Ampere、Hopper等用于高性能計算和AI訓(xùn)練的架構(gòu),并在此基礎(chǔ)上推出了V100、A100、H100等高端GPU。面向向量的雙精度浮點運算能力從7.8 TFLOPS一路走到30 TFLOPS。
作為全球第二大獨立GPU供應(yīng)商,AMD雖在高端GPU的整體份額與英偉達存在差距,但在超算領(lǐng)域闖出了一片天。在最新全球超級計算機TOP500榜單上,世界上最快的超級計算機橡樹嶺國家實驗室(ORNL)前沿、世界排名第三的超級計算機LUMI,都采用了AMD EPYC處理器和AMD Instinct MI250X GPU加速器。
AMD在超算領(lǐng)域的亮眼表現(xiàn),是建立在針對性的軟硬件設(shè)計上,基于CDNA 2架構(gòu)的GPU加速器、ROCm軟件平臺與開源應(yīng)用程序資源中心AMD Infinity Hub的組合,構(gòu)成了對于科研人員更加友好的硬件性能和編程環(huán)境。
雖然直接使用GPU進行高性能或AI計算更方便,但上層應(yīng)用降本增效的核心需求對底層算力提出了更高的要求。國外AI創(chuàng)業(yè)公司推出的AI芯片往往基于一種新的架構(gòu),全面提升并側(cè)重優(yōu)化并行計算能力。國內(nèi)領(lǐng)先的AI芯片公司也出于同樣的考慮,推出了一系列基于DSA架構(gòu)的人工智能計算芯片。
在國內(nèi)市場,基于架構(gòu)創(chuàng)新的DSA芯片產(chǎn)品日益豐富。如華為自研的面向AI計算的架構(gòu)特色達芬奇,昆侖芯科技推出的第一代架構(gòu)XPU-K和第二代架構(gòu)XPU-R,燧原科技的自研架構(gòu)GCU-CARA等,都已經(jīng)進入規(guī)模落地階段。隨著AI計算的應(yīng)用場景越來越細分和復(fù)雜,定制化和異構(gòu)化DSA有望在下一代計算平臺中發(fā)揮更大的作用。
新應(yīng)用領(lǐng)域?qū)映霾桓F
全球災(zāi)難性氣候事件正在不斷增加,提前預(yù)測此類事件對保護人類安全越來越重要,因此未來一年與氣候預(yù)測相關(guān)的應(yīng)用程序?qū)⒃贖PC領(lǐng)域備受關(guān)注。此外,隨著HPC在云端的使用,將有更多HPC應(yīng)用于消費導(dǎo)向的軟件程序開發(fā),虛擬世界和元宇宙概念的出現(xiàn),也讓HPC迎來新的發(fā)展機遇,既可用于游戲(AR/VR)等娛樂應(yīng)用,也可用于數(shù)字孿生等模擬應(yīng)用。
HPC市場正在擴展新的領(lǐng)域,在傳統(tǒng)的模擬和建模過程中加入人工智能(AI)和數(shù)據(jù)分析技術(shù)。新冠疫情的爆發(fā)增加了對靈活、可擴展的云端HPC解決方案的需求,這一需求連同各個垂直行業(yè)(生命科學(xué)、汽車、金融、游戲、制造業(yè)、航空航天等)對快速處理數(shù)據(jù)和高精度日益增長的需求,將會是未來幾年推動HPC應(yīng)用增長的主要因素。AI、邊緣計算、5G等技術(shù)將拓寬HPC的功能,從而形成新的芯片/系統(tǒng)架構(gòu),為各個行業(yè)提供高效處理和分析能力。
提高HPC安全性將成為關(guān)鍵
當(dāng)市場整體的數(shù)字化程度提升,則安全風(fēng)險也將隨之增加。越來越多的高性能計算正在遠離數(shù)據(jù)中心,將直接導(dǎo)致無法通過軟件補丁處理的攻擊數(shù)量增加。這給開發(fā)團隊帶來巨大壓力,迫使他們緊急推出硬件來解決這些問題,由此縮短硬件設(shè)計周期。因此提高開發(fā)者的生產(chǎn)效率以緊跟上市需求的步伐將成為下一步布局重點。
HPC處理器架構(gòu)多樣化
隨著數(shù)據(jù)量增加,不僅是安全性,基礎(chǔ)設(shè)施存儲以及數(shù)據(jù)處理的計算能力必須得到提升。此外,新的架構(gòu)包括芯片間的連接也是推動新需求所必需的。
受到不斷變化的AI工作負載、靈活的計算(CPU、GPU、FPGA、DPU等)、成本、內(nèi)存和IO吞吐量等因素共同驅(qū)動,HPC架構(gòu)正在經(jīng)歷巨變。微架構(gòu)層面變得互連更快、計算密度更高存儲可拓展、基礎(chǔ)設(shè)施效率更高、生態(tài)友好性、空間管理和安全性更高。從系統(tǒng)的角度來看,下一代HPC架構(gòu)將出現(xiàn)分解架構(gòu)和異構(gòu)系統(tǒng)的爆炸式增長,不同的專用處理架構(gòu)將集成在單個節(jié)點中,在模塊之間實現(xiàn)精密、靈活的切換。如此復(fù)雜的系統(tǒng)也帶來了巨大的驗證挑戰(zhàn),尤其是系統(tǒng)的IP或節(jié)點、軟硬件動態(tài)協(xié)調(diào)、基于工作負載的性能、電源等相關(guān)驗證。要滿足這些驗證需求,需要開發(fā)新的軟硬件驗證方法。
移動數(shù)據(jù)對電力和時間有很大的需求,這是系統(tǒng)管理者現(xiàn)在面臨的挑戰(zhàn)之一,減少數(shù)據(jù)移動量將成為未來的一種趨勢。我們需要繼續(xù)擴展資源,利用高級封裝和芯片間接口來支持更高性能的設(shè)備,即通過使用多裸晶來擴展設(shè)備內(nèi)的處理能力,這在未來一年內(nèi)有望真正實現(xiàn)。
高性能計算
液冷解決方案
在深度學(xué)習(xí)、視覺計算、圖像渲染、數(shù)據(jù)科學(xué)、機器學(xué)習(xí)的迅猛發(fā)展的大背景下,高性能計算HPC、液冷散熱已經(jīng)不再是少數(shù)大公司或大型科研機構(gòu)的專屬要求,而是被越來越多的包括政府、教育科研、遙感測繪、醫(yī)藥研發(fā)、小分子研究、細胞治療、圖像識別的客戶所需要和接受。
藍海大腦為滿足客戶需求,結(jié)合行業(yè)特點從計算節(jié)點、網(wǎng)絡(luò)、存儲、功耗、擴展、散熱等方面出發(fā),提出完善的解決方案。
產(chǎn)品特性
機架式液冷設(shè)計,即插即用,快速輕松投入使用;
支持最多9塊GPU圖形卡和2顆CPU處理器;
機架的存儲空間可大大擴展,可用于云存儲服務(wù);
液冷系統(tǒng)密度更高、更節(jié)能、防噪音效果更好;
高效節(jié)能、綠色環(huán)保
客戶收益
超融合架構(gòu)承擔(dān)著計算資源池和分布式存儲資源池的作用,極大地簡化了數(shù)據(jù)中心的基礎(chǔ)架構(gòu),通過軟件定義的計算資源虛擬化和分布式存儲架構(gòu)實現(xiàn)無單點故障、無單點瓶頸、彈性擴展、性能線性增長等能力。
通過簡單方便的統(tǒng)一管理界面,實現(xiàn)對數(shù)據(jù)中心計算、存儲、網(wǎng)絡(luò)、虛擬化等資源的統(tǒng)一監(jiān)控、管理和運維。
超融合基礎(chǔ)架構(gòu)形成的計算資源池和存儲資源池直接可以被云計算平臺進行調(diào)配,服務(wù)于OpenStack、EDP、Docker、Hadoop、R、HPC等IaaS、PaaS、SaaS平臺,對上層的應(yīng)用系統(tǒng)或應(yīng)用集群等進行支撐。
分布式存儲架構(gòu)簡化容災(zāi)方式,實現(xiàn)同城數(shù)據(jù)雙活和異地容災(zāi)。現(xiàn)有的超融合基礎(chǔ)架構(gòu)可以延伸到公有云,可以輕松將私有云業(yè)務(wù)遷到公有云服務(wù)。
審核編輯 黃昊宇
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4978瀏覽量
102990 -
gpu
+關(guān)注
關(guān)注
28文章
4729瀏覽量
128890 -
高性能計算
+關(guān)注
關(guān)注
0文章
82瀏覽量
13385
發(fā)布評論請先 登錄
相關(guān)推薦
評論