3月19日上午,英偉達2024 GTC AI大會,黃仁勛發布了英偉達最新一代AI芯片Blackwell GPU,AI算力能力較上代提升30倍!
黃仁勛說:"我們已經來到了一個臨界點,因此需要一種新的計算方式來加速整個行業的發展效率。那么英偉達能夠做什么?當然,答案就是——更大的芯片。”接著,英偉達新一代圖形計算平臺Blackwell正式登場,它被英偉達稱為 “新工業革命的引擎”。
采用全新Blackwell架構的B200和GB200系列芯片正式到來。
Blackwell以第一位入選美國國家科學院的黑人學者、數學家David Harold Blackwell的名字命名,它將允許客戶能夠在萬億參數大型語言模型上構建和運行實時生成人工智能。
Blackwell平臺引入了六項開創性技術來支持高達10萬億參數的AI模型訓練和大語言模型的實時推理。有望在數據處理、工程模擬、電子設計自動化、計算機輔助藥物設計、量子計算和生成人工智能等領域實現新的突破。用黃仁勛的原話來說,它就是“當今世界上最強大的芯片”。這六項技術分別為:
更大芯片:Blackwell 架構 GPU 擁有2080億個晶體管,尺寸是Hopper(800億晶體管)的兩倍多。Blackwell B200不是傳統的單一GPU,而是由兩個緊密耦合的芯片組成,這兩個芯片通過10 TB/秒的芯片到芯片鏈路連接成了一個統一的GPU 。
第二代Transformer引擎:配備了新的微張量縮放支持和先進的動態范圍管理算法,通過創新的4位浮點AI推理功能使計算和模型大小加倍。
第五代 NVLink 網絡技術:最新的NVLink迭代增強了數萬億參數AI模型的性能,為每個GPU提供了高達1.8TB/s的雙向吞吐量,確保當今最復雜的大語言模型能在多達576個GPU之間實現無縫高速通信。
RAS引擎:Blackwell驅動的GPU集成了專用引擎和基于人工智能的預防性維護功能,可確保可靠性、可用性和可維護性,從而最大限度地延長系統運行時間并最大限度地降低運營成本。
安全人工智能:全新的機密計算功能可在不影響性能的情況下保護人工智能模型和客戶數據,并支持新的本機接口加密協議,在傳輸過程中、靜止狀態和計算時都能保證安全。
解壓縮引擎:通過支持最新格式加速數據庫查詢,增強數據分析和數據科學性能,徹底改變數據處理。
英偉達表示,此前訓練一個1.8萬億參數模型需要用到8000個Hopper GPU和 15兆瓦的功率。而如今,同樣的訓練量2000個Blackwell GPU就可以做到,功耗僅為4兆瓦。
基于Blackwell,此次英偉達還推出了其AI超級芯片GB2000。GB2000由兩個B200 Blackwell GPU和一個基于Arm的Grace CPU組成,可以為大語言模型推理工作負載提供30倍的性能,而成本能耗要比其“前輩”Hopper低25倍。在具有1750億個參數的GPT-3 LLM基準測試中,GB200的性能是H100的7倍,訓練速度是H100的4倍。
GB200還將成為英偉達全新大型機架系統GB200 NVL72的基石。該系統擁有72個Blackwell GPU和36個Grace GPU,擁有1.4 exaflops的AI性能和30TB的快速內存。英偉達表示,該系統可以部署27萬億參數的模型,而目前最大的模型GPT-4僅約有1.7萬億個參數,因此能夠加快釋放生成式AI的能力。
審核編輯:劉清
-
人工智能
+關注
關注
1791文章
47183瀏覽量
238247 -
英偉達
+關注
關注
22文章
3770瀏覽量
90985 -
AI芯片
+關注
關注
17文章
1879瀏覽量
34990 -
大模型
+關注
關注
2文章
2423瀏覽量
2640
原文標題:剛剛!英偉達發布“AI核彈”!
文章出處:【微信號:CSF211ic,微信公眾號:中國半導體論壇】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論