電子發(fā)燒友網(wǎng)報道(文/李彎彎)11月9日,黃仁勛在NVIDIA GTC上發(fā)表主題演講,發(fā)布了一系列新品,包括ReOpt、cuQuantum、cuNumeric,以及Quantum-2平臺、Modulus、Omniverse、Maxine、Clara Holoscan等等。
ReOpt
ReOpt,一款針對運(yùn)籌優(yōu)化問題(比如車輛路線安排和倉庫揀選與包裝)的加速求解器,配送14個披薩的路徑有870億種,因此對于達(dá)美樂來說,要在30分鐘內(nèi)將披薩送達(dá)并非易事,運(yùn)籌優(yōu)化對于最后一公里配送來說是必需的,對于倉儲及制造物流而言也是如此。
路線規(guī)劃是一個極其棘手的物流問題,應(yīng)用到行業(yè)里,即使是小規(guī)模的路線優(yōu)化也能節(jié)省數(shù)十億美元,示例,使用NVIDIA Omniverse中的虛擬倉庫,來展示優(yōu)化路線在自動訂單揀選場景中帶來的影響,優(yōu)化后的規(guī)劃能夠使訂單揀選節(jié)省一半的時間和路程,當(dāng)前路線優(yōu)化求解器在收到新的訂單后,需要數(shù)小時來重新運(yùn)行和響應(yīng),NVIDIA ReOpt能夠持續(xù)運(yùn)行并實時動態(tài)地進(jìn)行重新優(yōu)化。
cuQuantum
量子計算依靠的是,疊加和糾纏的自然量子物理現(xiàn)象,因此有潛力解決伴隨組合復(fù)雜性增加而出現(xiàn)的問題,在世界各地的大學(xué)、科學(xué)實驗室、企業(yè)和初創(chuàng)公司中,有近100個團(tuán)隊正在致力于量子處理器、系統(tǒng)、模擬器和算法的研究,但預(yù)計還需要十到二十年才能制造出一臺實用的量子計算機(jī)。同時,該行業(yè)還需要一個超高速的量子模擬器來驗證其研究。
NVIDIA創(chuàng)建了cuQuantum DGX設(shè)備,該設(shè)備配備有針對量子計算工作流的加速庫,可以使用態(tài)矢量和張量網(wǎng)絡(luò)的方法,來加速量子電路模擬。曾經(jīng)需要耗費(fèi)幾個月時間的模擬現(xiàn)在只需要幾天就可以完成,,NVIDIA將在第1季度推出cuQuantum DGX設(shè)備。
通過DGX上的cuQuantum,量子計算機(jī)和算法研究人員可以使用當(dāng)今速度最快的計算機(jī)來發(fā)明未來的計算機(jī),NVIDIA將在第1季度推出cuQuantum DGX設(shè)備。
cuNumeric
Python是科學(xué)家、機(jī)器學(xué)習(xí)與AI研究人員使用的編程語言,Python擁有豐富的庫生態(tài)系統(tǒng),包括用于DataFrame進(jìn)行數(shù)據(jù)分析的Pandas,用于n維數(shù)組與矩陣運(yùn)算的NumPy,用于機(jī)器學(xué)習(xí)的Scikit-Learn,用于科學(xué)計算的SciPy,用于深度學(xué)習(xí)的PyTorch。Python擁有近2000萬名用戶。
在會上還宣布推出NumPy的插入式加速庫cuNumeric,cuNumeric加速了NumPy從單一GPU擴(kuò)展到多GPU,擴(kuò)展到多節(jié)點集群,進(jìn)而擴(kuò)展到世界上最大的超級計算機(jī),其并行性以隱含的方式自動完成。
cuNumeric具有很好的可擴(kuò)展性,在著名的CFD Python教學(xué)代碼中,cuNumeric能夠擴(kuò)展至1000個GPU,而擴(kuò)展效率僅比線性擴(kuò)展效率損失了20%。
黃仁勛表示,ReOpt、cuQuantum、cuNumeric,三個極佳的新庫。
Quantum-2平臺
在分布式計算中,網(wǎng)絡(luò)是計算機(jī)的重要中樞神經(jīng)系統(tǒng),網(wǎng)絡(luò)將數(shù)以千計的GPU連接成一個巨型的超級計算機(jī),是其擴(kuò)展能力和最終性能的決定因素。
Quantum-2是一個400Gbps的InfiniBand平臺,由Quantum-2交換機(jī),ConnectX-7網(wǎng)卡、BlueField-3 DPU以及一整套面向這種新架構(gòu)的軟件組成,Quantum-2是首個集超級計算機(jī)的性能和云計算的多租戶共享能力于一身的網(wǎng)絡(luò)平臺。
黃仁勛表示,在Quantum-2之前,我們只能在裸機(jī)的高性能或安全的多租戶之間選其一,無法兩者兼得,Quantum-2平臺的出現(xiàn),使超級計算機(jī)擁有了原生云的能力,并得到更好的優(yōu)化。如果NVIDIA 的Selene DGX超級計算機(jī),如今也配備Quantum-2,則總帶寬將達(dá)到每秒224000GB/s,大約是互聯(lián)網(wǎng)總流量的1.5倍。
Quantum-2平臺的InfiniBand交換機(jī)芯片,共計570億個晶體管,采用臺積電7nm制程,和NVIDIA的A100 GPU相近,支持64個400Gbps端口或128個200Gbps端口,一個基于Quantum-2的系統(tǒng)可連接多達(dá)2048個端口,相較于800個端口的Quantum-1的交換容量多了5倍。
采用Dragonfly拓?fù)洌赒uantum-2的網(wǎng)絡(luò)可以僅用3個hop就擴(kuò)展到100萬個節(jié)點,這比當(dāng)前一代增加了6.5倍,這種網(wǎng)絡(luò)速度、交換容量和可擴(kuò)展性對于需要構(gòu)建的巨型HPC系統(tǒng)來說來得正是時候,目前Quantum-2交換機(jī)正處于樣機(jī)階段。
Quantum-2平臺在主機(jī)端提供兩個選項:ConnectX-7和BlueFied-3。黃仁勛稱,ConnectX-7將是速度最快的網(wǎng)卡,包含80億個晶體管,采用臺積電7nm制程,是目前世界上速度最快的網(wǎng)絡(luò)芯片,比上一代ConnectX-6快兩倍。ConnectX-7樣品將于明年1月問世。
Quantum-2平臺還提供BlueFied-3 InfiniBand系列方案,通過16個64位Arm CPU來卸載和隔離數(shù)據(jù)中心基礎(chǔ)設(shè)施棧操作,BlueFied-3采用臺積電7nm制程,包含220億個晶體管,BlueFied-3樣品將于明年5月問世。
黃仁勛說:“Quantum-2是迄今為止構(gòu)建的非常先進(jìn)的網(wǎng)絡(luò)平臺,將由頂級計算機(jī)制造商提供,這將大大推動高性能計算。”
Modulus
NVIDIA Modulus是一種開發(fā)Physics-ML模型的框架,它使用物理原理以及源自原理型模型和觀測結(jié)構(gòu)的數(shù)據(jù)訓(xùn)練Physics-ML模型,Modulus已經(jīng)過優(yōu)化,可以在多個GPU和多個節(jié)點上進(jìn)行訓(xùn)練,由此生成的模型,其物理仿真的速度比模擬快1000到10萬倍。
借助Modulus,科學(xué)家能夠創(chuàng)建數(shù)字孿生模型,以前所未有的方式更好地理解大型系統(tǒng),Modulus可以用來解決的一個重要問題,即是氣候科學(xué)。黃仁勛介紹:“我們可以創(chuàng)造地球的數(shù)字孿生模型,它可以持續(xù)運(yùn)行以預(yù)測未來,用觀測到的數(shù)據(jù)進(jìn)行校準(zhǔn)并改進(jìn)預(yù)測,然后再預(yù)測。”
研究人員利用歐洲中期天氣預(yù)報中心的ERA5大氣數(shù)據(jù)訓(xùn)練Physics-ML模型,該模型在128個A100 GPU上訓(xùn)練需要4個小時,訓(xùn)練后的模型能以30公里的空間分辨率,預(yù)測颶風(fēng)的嚴(yán)重程度和路徑,原本需要7天才能完成的預(yù)測,如今在一個GPU上只需四分之一秒。
虛擬世界模擬引擎Omniverse
Omniverse面向數(shù)據(jù)中心規(guī)模設(shè)計,Omniverse的門戶是USD(通用場景描述),本質(zhì)上是一個數(shù)字蟲洞,將人和計算機(jī)鏈接到Omniverse,并將一個Omniverse世界鏈接到另一個世界,公司可以在Omniverse中建立虛擬工廠,并使用虛擬機(jī)器人進(jìn)行運(yùn)營。虛擬工廠和機(jī)器人是其物理復(fù)制品的數(shù)字孿生。
自去年年底推出以來,Omniverse已被500家公司的設(shè)計師下載了70000次,社區(qū)、公司和工具供應(yīng)商與NVIDIA一起構(gòu)建Omniverse連接器,14個已經(jīng)投入運(yùn)行,還有15個即將推出,Bentley宣布帶有Omniverse的iTwin現(xiàn)在正處于搶先體驗階段,另外還有寶馬和愛立信。
Clara Holoscan
NVIDIA Clara Holoscan,一款軟件定義的可編程影響平臺,以及全新的高速傳感器處理機(jī)器人芯片Orin。
基礎(chǔ)Holoscan平臺由Orin和ConnectX-7組成,Orin可以在單個芯片中處理整個機(jī)器人流水線,即傳感器、物理、AI、成像和圖形,12個Arm CPU,5.2TFLOPS(FP32),用于AI的250TOPS,740Gbps高速IO用于連接傳感器,使用者可以選擇添加A6000 Ampere GPU獲得另外39TFLOPS(FP32)和超過500TOPS的AI推理性能。
Holoscan平臺是開放的,第三方可以在Holoscan的界面和API的基礎(chǔ)上進(jìn)行構(gòu)建,研究人員可以從事重要的新科學(xué)研究、儀器制造商可以將Holoscan集成到他們的解決方案中,Holoscan應(yīng)用程序可以完整部署在設(shè)備內(nèi)、醫(yī)院的數(shù)據(jù)中心或者兩者結(jié)合,這使得公司可以開放比設(shè)備本身需要更多算力的應(yīng)用程序,或者升級部署多年的已安裝基礎(chǔ)設(shè)備。
黃仁勛在演講的最后表示還有一項公告要發(fā)布,“我們將構(gòu)建一個數(shù)字孿生模型來模擬和預(yù)測氣候變化,上一臺超級計算機(jī)名為Cambridge 1,即C-1,這臺新的超級計算機(jī)將名為E-2。Earth Two ,地球的數(shù)字孿生,能夠在Omniverse中以Million-X百萬倍的速度運(yùn)行,目前發(fā)明的所有技術(shù),均是實現(xiàn)Earth Two必不可少的,我想象不出筆者更宏偉、更重要的用途。”
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4983瀏覽量
103006 -
gpu
+關(guān)注
關(guān)注
28文章
4733瀏覽量
128908 -
AI
+關(guān)注
關(guān)注
87文章
30805瀏覽量
268930
發(fā)布評論請先 登錄
相關(guān)推薦
評論