10月17日晚間消息,美國商務部延長了在2022年10月首次實行的全面出口管制,將收緊對尖端人工智能芯片的出口管制。
在新規下,英偉達旗下先進的GPU、顯卡等將被禁止向中國市場出售,其中還包含了A800和H800這樣專門為中國市場定制的芯片。AMD、英特爾等芯片巨頭的高性能芯片也將被限制向中國出口。
此次美國出口管制規則更新后,還擴大了芯片制造工具出口限制清單,中國的兩家國產GPU制造商——摩爾線程、壁仞科技被列入“實體清單”。
業內認為,此次禁售意味著美方試圖對我國算力發展作進一步遏制,同時也對模型端發展有所限制,因此國產GPU廠商需要加速發展。
、
AI時代漸近,GPU需求的高速增長幾乎毋庸置疑。在美國屢次禁售高速GPU的背景下,GPU的國產化進程如何?

英偉達高性能
GPU供不應求
ChatGPT意外掀起的一波AI革命,帶火了AI芯片市場。而英偉達旗下A100和H100兩款AI芯片,正是ChatGPT這樣的大語言模型的核心動力。
目前在GPU領域,大部分國內企業仍然只能仰賴英偉達一家的技術。由于美國政府收緊對華出口管制,以及AI大模型帶來的龐大算力需求,英偉達的高性能GPU處理器“一芯難求”。
從去年開始,英偉達旗下A100、H100、A800、H800等高性能GPU芯片應聲漲價,尤其旗艦級芯片H100,4月中旬在海外電商平臺就已炒到超4萬美元,甚至有賣家標價6.5萬美元一片。
同時,英偉達的中國特供版A800和H800芯片也遭到了哄搶,整個市場需大于求,缺貨非常厲害。有業內人士表示,今年這類GPU芯片從原來的12萬人民幣左右,變成了現在是25萬甚至30萬,甚至有高達50萬一片。
即便價格不斷暴漲,國內大廠也不得不大批量買芯片。
據媒體報道稱,百度、字節跳動、騰訊和阿里巴巴向英偉達下單訂購50億美元的芯片。其中,字節跳動今年已向英偉達訂購了超過10億美元的GPU產品,僅字節一家公司今年的采購量就已經接近英偉達去年在中國銷售的商用GPU總銷售額。
此次美國出口管制再次收緊,多家國內廠商表示已提前接到美國更新出口管制規定的通知,已提前進行囤貨。
據媒體消息,騰訊、百度等大廠由于“囤貨充足”,受“禁令”影響或有限。也有廠商表示,雖然目前已經囤了足夠量,不過未來還是有很大壓力。
這種壓力,一方面來自國內對于AI算力需求的暴增,另一方面也源于國產AI芯片的差距。

國產AI芯片與
英偉達差距幾何
一個不可否認的事實是,國內相關的芯片產品都和英偉達A100有較大差距。
曾有人坦言,英偉達與其他芯片廠商的差距,是院士與高中生的差別。就如同黃仁勛所言,英偉達“一直在奔跑”,想要超越巨人的其它芯片廠商只能奮力狂奔。
據《電子工程專輯》發布的《45家國產AI芯片廠商調研分析報告》顯示,在調研分析了瀚博半導體、燧原科技、平頭哥、華為海思、紫光展銳、寒武紀、地平線等國內AI芯片廠商后,得出一個結論:
“國產AI芯片公司在高性能和先進工藝AI芯片的設計方面還面臨諸多挑戰,而且在AI芯片價值鏈的EDA和IP環節上還有不小的差距。”
目前,國內AI芯片廠商格局可大致分為三個梯隊:
一梯隊,有成熟產品、批量出貨的企業,包括寒武紀、華為昇騰、百度昆侖芯、燧原科技等;
二梯隊,以AI芯片起家的壁仞科技、天數智心、摩爾線程、沐曦等;
三梯隊,如海光、景嘉微等。
那么,這些國產AI芯片和英偉達芯片相比,處于什么樣的水平?綜合業界測評和實際部署的情況,以下是部分國產AI芯片的現狀:
- 華為昇騰910與英偉達的差距
2018年,華為推出了昇騰系列(HUAWEI Ascend) 芯片,主要產品有昇騰310與昇騰910。
目前昇騰910是業界算力最強的AI處理器,芯片基于自研華為達芬奇架構3D Cube技術,實現業界極佳AI性能與能效。測試數據顯示,昇騰910算力是英偉達V100的兩倍,略超 “A100 80GB PCIe”版本。
受到2019年開始的制裁影響,原計劃在2021年推出用于訓練場景的昇騰920研發進度向后延宕,發展進度受到巨大影響。
目前,華為昇騰只能用于華為自身生態中的大模型業務,比如昇騰不能做GPT-3,因為昇騰910不支持32位浮點,而目前大模型訓練幾乎都要使用32位的浮點,所以華為昇騰芯片只能利用華為開發的框架(如MindSpore),在加上優化好的大模型,比如盤古CV。
由于任何公開模型都必須經過華為的深度優化才能在華為的平臺上運行,所以可以理解為華為昇騰只能運行自己閉環的大模型產品。
- 百度昆侖2代與英偉達的差距
百度已有兩款產品,都在百度云服務器上部署:
一是,2018年下半年發布昆侖芯一代產品,基于三星14nm,可以做訓練和推理,因此主要用于推理。
二是,2021年發布昆侖芯二代產品,搭載GDDR6高性顯存,支持256TOPS(INT8)算力,和V100差距縮小,可以做訓練和推理。
第三代昆侖芯產品,預計明年上半年發布。
- 寒武紀思元590與英偉達的差距
寒武紀主要還是ASIC架構,劣勢是通用性會比較差,優勢是某些特定應用場景下,算力可以做到比GPU更高。
百度內部的測試結果顯示,寒武紀最好的產品思元590,性能接近A100 90%的性能;思元590基本支持主流的模型,綜合性能接近A100 80%的水平。
目前,百度文心一言在訓練端主要使用英偉達產品V100和A100,在推理端主要使用英偉達A100和百度昆侖芯2代,小規模部署了寒武紀思元590。
但實際上線中并沒有使用思元590,主要原因在于其性能指標不如A100,而且架構不太兼容、難度大。
- 壁仞科技與英偉達的差距
壁仞科技去年發布的產品規格很高,但主要還是停留在紙面數據,實測數據、實際性能方面業界和第三方評測機構評價沒有那么高,它本身的性能是不及A100的。
在軟件層面也還有很多工作要做,目前它只是做了一個軟件的雛形,從使用維度來講離成熟的生態軟件、規模化的出貨、客戶端的個適配還有很?的路要走。
現在它也面臨著制裁問題、實體清單問題,對于這樣的初創企業是生存層面的問題。
像天數智芯、摩爾線程、沐曦也都陸續有產品推出,但技術能力不及壁仞,只是停留在推理層面,不像第一梯隊的企業有更成熟的產品經驗。
- 景嘉微JM9與英偉達的差距
景嘉微最好的JM9系列,可以滿足目標識別等部分人工智能領域的需求,但不能滿足AI計算、ChatGPT等領域的應用需求。大概達到英偉達GTX 1050的水平,只能算入門級GPU。
- 海光DCU Z100與英偉達的差距
海光是做X86CPU起家的,GPU的技術能力還有待市場的認可和檢驗。
目前,海光訓練產品的算力規模不足以支持做數據中心。海光DCU Z100訓練算力較小,不到100TFLOPS,只適合一些推理場景,不足以支持大模型的訓練,因此沒有能力去替代英偉達的產品。
從產品層面來講,海光離傳統做AI芯片的企業還是有較大的技術差距。
總體而言,國內已經批量生產的AI芯片,大多都是A100的上一代。目前能運行大模型訓練的,還是英偉達的A100、A800、H100、H800效率最高。
這意味著,想要達到同樣的算力,需要企業購置更多的國產AI芯片。對企業而言,就意味著更多的成本支出。

國產GPU芯片
自研任重道遠
需要承認的是,國產AI芯片產品走向高端還有較遠的距離。
除了技術上的差距,國產GPU在生態建立方面仍不如英偉達完善,這也使得很多國內廠商不敢輕易改用***。
據一家國產GPU廠商銷售人員透露,目前國內第一批大模型廠商使用的基本都是英偉達A100、A800的芯片,因為英偉達構建了完善的CUDA生態。
“如果你用慣了這個生態,”該銷售人員說,“貿然換一個生態,意味著你的學習成本、試錯成本、調試成本都會增加,自然沒人會想要換了”。
眾所周知,芯片需要適配硬件系統、工具鏈、編譯器等多個層級,需要很強的適配性,否則會出現這款芯片在某個場景能跑出90%的算力,在另一場景只能跑出80%效能的情景。
早在2006年,英偉達就推出了計算平臺CUDA,這是一個并行計算軟件引擎,CUDA框架里集成了很多調用GPU算力所需的代碼,工程師可以直接使用這些代碼,無須一一編寫。開發者可使用CUDA更高效地進行AI訓練和推理,更好的發揮GPU算力。
時至今日,CUDA已成為全球AI基礎設施,主流的AI框架、庫、工具都以CUDA為基礎進行開發。
雖然英偉達GPU價格貴,但實際用起來反而是最便宜的。這對有意抓住大模型機會的企業來說,錢往往不是問題,時間才是更寶貴的資源,大家都必須盡快獲得足夠多的先進算力來確保先發優勢。
因此,對于***供應商來講,哪怕能通過堆芯片的方式能堆出一個算力相當的產品,但軟件適配與兼容讓客戶接受更難。
此外,從服務器運營的角度,它的主板開銷、電費、運營費,以及需要考慮的功耗、散熱等問題,都會大大增加數據中心的運營成本。
由此可見,國產GPU在與英偉達的競爭中阻力重重,想實現突圍并不容易。
但值得注意的是,此次美國限制出口政策的收緊,又一次為國內廠商敲響了警鐘。
盡管***在性能和軟件生態上比不過英偉達、AMD等行業巨頭,但在復雜的國際貿易關系及地緣政治因素等驅動下,“國產替代”成為國內半導體行業發展的主旋律。
從安全性以及自主可控的角度來說,這也為國內AI芯片企業提供了新的機遇窗口。
一位業內人士分析稱,在當前“缺芯”的形勢下,國內大模型廠商可以在不是特別商業化的場景多給***機會,支持***廠商技術迭代,共同營造生態,共同成長。
不僅如此,目前全國各地的智能算力中心建設穩步推進,AI芯片的需求快速增長,國產化替代的需求也隨之提升。
中國巨大的AI市場體量和快速迭代的發展進程,為眾多國產AI芯片廠商提供了豐富的試驗基地和應用設計機會。接下來的3-5年,將是國產AI芯片廠商加速AI應用落地和大規模部署的快速發展時期。
“AI算力國產化”的市場大門,或許正在打開。
審核編輯 黃宇
-
芯片
+關注
關注
459文章
51568瀏覽量
429783 -
gpu
+關注
關注
28文章
4830瀏覽量
129778 -
AI
+關注
關注
87文章
32439瀏覽量
271625 -
英偉達
+關注
關注
22文章
3872瀏覽量
92451 -
算力
+關注
關注
1文章
1043瀏覽量
15101
發布評論請先 登錄
相關推薦
傳DeepSeek自研芯片,廠商們要把AI成本打下來

AFE5816在12位ADC的應用中,0V輸入對應的輸出是12‘h000還是12’h800?
華迅光通AI計算加速800G光模塊部署
英偉達H20 AI芯片:中國市場新動向與業績預期
英偉達H200芯片將大規模交付
英偉達GPU新品規劃與HBM市場展望
進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片
英偉達、AMD、英特爾GPU產品及優勢匯總
國內GPU新勢力:能否成為英偉達的“終結者”?

英偉達芯片“倒爺”風光不再,市場熱度降溫

評論