近日,自稱為國內自主創新的通用GPU領軍企業的登臨科技獲得中國互聯網投資基金(簡稱“中網投”)獨家投資。
公司稱,這將為登臨新一代Goldwasser(高凜)規模化量產及商業化落地提供重要保障。
高凜是一款AI加速卡,首款產品2021年量產投入市場,2022年銷售過萬片。
第二代產品2022年流片,2023年實現量產。根據現有客戶測試結果,二代產品針對基于transformer類型的模型提供3-5倍的性能提升,大幅降低類ChatGPT及生成式AI應用的硬件成本。
在官網,登臨介紹自己是國內首家完全憑借自主創新,實現規模化商業落地的通用GPU企業,登臨科技核心IP完全自主研發,其自主創新的GPU+(基于GPGPU的軟件定義的片內異構計算架構),在兼容 CUDA/OpenCL 在內的編程模型和軟件生態的基礎上,通過架構創新,解決了客戶核心關注的通用性和高效率的雙重難題。
其表示,經過大量客戶產品化驗證,針對AI計算,GPU+相比現有主流GPU在性能及能效上有顯著提升。
在AI市場上,NVIDIA現在是沒有對手的階段,AI顯卡份額估計在90%以上,AMD都很難競爭,現在Intel也加入這個市場了,而且找到了NVIDIA的一個痛點,那就是性價比。
NVIDIA目前受追捧的AI顯卡主要是A100、H100,國內有特供的閹割版A800、H800,性能比原版弱20%左右,但即便如此依然供不應求,A800一周時間就從9萬元漲到11萬元以上,H100價格在25萬元以上,H800也要20萬出頭,而且不同經銷商的價格差異很大。
Intel自然也不會放過這個市場,日前在國內舉行發布會,也推出了AI顯卡Habana Gaudi2,這是去年底發布的AI推理加速芯片,從第一代的16nm工藝升級到7nm工藝,Tensor 處理器核心數量增至 24 個,同時集成了多媒體處理引擎,內存升級至 96GB HBM2E。
國內版的Gaudi2主要是閹割了部分網絡接口,但也集成了21路100Gbps網絡接口,總體來說性能依然很可觀。
Intel還公布了Gaudi2跟H100的AI性能對比,面對要求極為苛刻的、1750億參數的GPT-3模型,384個Gaudi2加速器上的訓練時間僅為311.9分鐘,而且從256個加速器到384個加速器,性能擴展幅度達95%。
NVIDIA這邊在512塊 H100 GPU上的訓練時間則為64分鐘,論單卡性能的話是Gaudi2的3.6倍多,但是Intel不會跟H100拼極限性能,而是強調性價比。
Habana Labs 首席運營官 Eitan Medina 表示,性價比是影響H100和Gaudi2相對價值的重要考量因素,Gaudi2 服務器的成本要比H100低得多。
更重要的是,目前Gaudi2還沒有支持AI常用的FP8運算格式,這種情況下Gaudi2 在性價比上也勝過了H100,今年3季度會升級支持FP8運算,Gaudi2的性能將有明顯飛躍,性價比要比H100更高了。
-
gpu
+關注
關注
28文章
4729瀏覽量
128890 -
AI
+關注
關注
87文章
30728瀏覽量
268888 -
ChatGPT
+關注
關注
29文章
1558瀏覽量
7596
原文標題:國內公司自主研發GPU+:兼容CUDA、性能及能效超競品
文章出處:【微信號:hdworld16,微信公眾號:硬件世界】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論