10月17日,美國加強了面向中國市場的AI芯片禁令。其中明確將性能、密度作為出口管制標準,將單芯片超過300teraflops算力,以及性能密度超過每平方毫米370 gigaflops的芯片都納入了禁止出口行列。
雖然在這一禁令下,AMD、英特爾等公司提供的高端AI芯片也受到影響。但由于英偉達在全球AI芯片領域一家獨大,本次禁令涉及A100、H100等主流AI訓練用英偉達GPU,因此這次的芯片禁令也被稱為“英偉達禁令”。
消息一出,立刻引起了AI產業的熱議。但討論大多集中在禁令何時施行,是否有緩沖地帶,具體涉及哪些GPU型號,禁令期限是多久等。這就導致一個顯而易見的宏觀背景被忽略了:自貿易摩擦發生以來,中美經貿關系雖然時有波動,但面向中國的芯片管控卻始終有增無減。尤其是高端AI芯片禁令,在諸多爭議中依舊被堅定推行。
至此,AI行業似乎已經必須形成一個基本的共識:拋棄幻想,準備斗爭。
與其斤斤計較哪些GPU被禁,是否有解禁可能。不如重新審視在芯片鐵幕時代下,中國AI計算究竟何去何從?
本文希望從目前的產業局面出發,和大家一起思考AI計算的前行之路。
目前的局面
首先我們必須了解一個問題,那就是為什么這次英偉達禁令出臺之后,大眾輿論與AI行業的反應都沒有18、19年芯片封鎖剛開始時嚴重。似乎只有在消費級顯卡RTX 4090是否被禁問題上,引發了游戲玩家和相關商家的一些爭論。
這背后的宏觀邏輯在于,行業是非常不愿意看到高端AI芯片被禁售的,但其實也對這種局面早有預料。一方面是美國對華芯片封鎖推動多年,此前英偉達部分高端GPU已經被禁,產業界的反饋早就從驚愕調整為了泰然處之。加上ChatGPT爆火之后今年全球高端GPU行情陡然看漲,隨之而來的是美國方面屢次表態要推動對華整體性的高端AI芯片禁售。虛虛實實幾個月之后,最終落下一錘也不外如是。
為了應對這次可預見的禁令,同時也有大模型發展的客觀推動,去年年底到今年上半年大量中國科技、金融、汽車等領域的企業集中囤貨英偉達高端GPU,已經造成了市面上一卡難求的局面。換句話說,對于很多中國中小型科技企業、AI創業公司來說,高端GPU本就買不到,禁售之后并沒有太多改變。
另外一個真實情況是,高端AI芯片并非無法國產化。早在18、19年貿易摩擦開始之后,國內AI芯片產業加速發展。這就導致在AI訓練需求上,英偉達高端GPU雖然很難被替代,但并非不可替代。
加上AI芯片并不像手機芯片那樣事關大眾消費者,且華為已經在手機芯片上完成了突破。種種跡象合在一起,導致無論是大眾還是行業,都對這次禁令產生了一種坦然,甚至有點見怪不怪的心態。
但必須客觀看到的是,這次禁令絕非對中國AI行業沒有傷害。一方面短期內更換英偉達GPU,無論在芯片產能、生態兼容性等問題上都非常困難。并且禁令還將直接在AI服務器等領域,給大規模使用英偉達產品的廠商造成傷害。
而更關鍵的問題在于未來,如果禁令長期存在,中國AI計算將逐漸與全球高端芯片脫鉤,那么可能帶來的長期負面影響是非常復雜的,比如說:
1.英偉達高端GPU代表的AI芯片在更新迭代之后,是否會造成中國AI算力的發展脫節?
2.底層算力出現發展分歧后,中國AI產業是否會在大模型等軟件技術發展中掉隊?
3.本次AI芯片禁令,已經呈現出大規模封鎖的特征。這種科技封鎖真的只會停留在AI芯片領域嗎?通用算力、存儲、基礎軟件等數字化基礎能力是否將成為接下來的打擊目標?
總而言之,這次的AI芯片禁令,對中國來說是一次有準備的博弈,而非一場奇襲。想要成功度過這一關,也需要將手中的每一張牌都打好,打出配合,從而降低傷害烈度,提升長期發展的勝率。
而就目前來看,中國AI計算有三項必須同時發力的“突圍方案”。
方案1:用好“買家”身份
有個簡單的道理,商業市場的行為邏輯是由供需決定的。但在以芯片為代表的中美科技貿易中,我們經常會陷入一個思維誤區:認為絕大部分游戲規則是由美國政府和企業制定的,他們想賣我們就買,他們不想買我們就無奈。
作為全球芯片市場的最大“買家”,中國企業卻沒有話語權,這是非常荒謬的。
事實上,針對中國市場的AI芯片禁令,最直接傷害的就是以英偉達為代表的美國科技巨頭。目前,英偉達AI芯片方面最大市場需求來自中國。此前英偉達CEO黃仁勛就明確表示,“如果被剝奪了中國市場,我們是沒有應急措施的,世界上沒有另一個中國”。
在這種情況下,我們能看到追求商業利益的美國科技公司,與追求政治利益的美國政府之間有著鮮明的矛盾。美國科技企業總是想方設法尋求反對禁令和繞過禁令,比如英偉達就從去年開始推出了應對禁運政策的中國特供版GPU。
中國市場,消化了美國科技企業約三分之一的產能,二者之間的供需紐帶是無法長期割裂的。面對美國愈發明顯的整體性科技封禁,中國市場也應該積極用好“買家”身份,讓自身的行為更具鮮明立場與可預測性。
避免造成一種“賣了就歡迎,不賣只能無奈”的表現和印象。
“買家身份”應該是一種有立場、有力量且會憤怒的身份。
方案2:以云代卡,算力集中
在可見的較長時間里,美國對中國的AI芯片封禁恐怕都只會加強,而這個時機恰好對應上AI大模型發展的關鍵階段。很多業內人士認為,大模型發展雖快,但沒有呈現出此前其他科技風口的迅猛局面,投資缺錢,計算缺卡是主要原因。
那么如何解決中國AI產業在禁令之下的算力缺口問題呢?首先的應急方案就是企業加大云端AI算力的配置和投入,推進以云代卡。
事實上,在高端AI芯片可能被禁的大趨勢下,中國幾大公有云廠商都做出了加強囤積英偉達高端GPU的動作。這一方面是因為云廠商自身要加大大模型投入,打開MaaS市場,所以對AI算力有直接需求。另一方面也是因為GPU轉化為云資源池之后可以長期復用,對于云廠商來說是一個進可攻,退可守的局面。因此,今年上半年一度出現了市面上高端AI芯片全都流向云廠商,中小企業一卡難求的局面。
客觀來看,這種高端AI芯片集中向云的舉動,對整個中國市場統籌應對AI芯片禁令是有利的,并且也符合東數西算的戰略思路。
另一個利好云端AI算力的趨勢在于,隨著大模型參數和使用數據量的不斷加大。本地化的卡池訓練已經愈發吃緊。必須在云端發生的千卡、萬卡訓練成為未來主要的發展方向,因此企業用戶天然會更積極走向云端。
同時,云端AI算力也不會僅僅停留在囤積英偉達GPU的層面。接下來,國產的自主AI算力駛入云端是大勢所趨。在相關政策的推動下,云廠商正在加大自主AI芯片的采購力度。根據IDC數據,2023年上半年中國AI服務器已經使用了50萬塊自主開發的AI加速器芯片。在自主AI算力的服務化方面,華為云已經推出了昇騰AI云服務。云端化與自主化結合的AI算力,將在AI芯片禁令背景下得到極大發展。
加上近些年在東數西算大背景下,各地陸續建立了大量采用自主AI算力的AI計算中心,整體來看中國的云端AI算力是供給穩定、保障可靠的。
而很多企業依舊傾向于采購本地AI算力。這一方面是因為英偉達GPU市場緊缺,保值性特別好,甚至能作為企業的核心資產。另一方面是因為云端AI算力往往會有排隊、宕機、軟件服務缺失等問題。
如何進一步提高開發者的云端AI算力使用體驗,是公有云廠商接下來需要發力的方向。
方案3:讓國產AI算力爆發式成長
面對新一輪AI芯片禁令,中國AI產業最大的底氣是什么?是多年之后的習以為常,還是大量屯卡之后的家有余糧?都不是。最關鍵的節點在于經過多年發展,中國AI芯片產業已經得到了巨大發展。英偉達的高端GPU確實依舊重要,但已經不是毫無替代選項可言。
根據IDC此前發布的數據,2022年中國AI加速卡出貨量約為109萬張,其中英偉達市場份額達到了85%,華為昇騰實市場占有率10%,百度昆侖為2%,寒武紀和燧原科技均為1%。
從中可以看出,國產AI算力已經實現了一定程度的市場占比,而不僅僅是概念與理論中的“紙上談兵”。同時也應該看到,國產AI芯片在核心性能、軟件生態以及出貨能力上依舊不理想,還有很長的路要走。在英偉達禁令的客觀條件倒逼下,國產AI算力必須在短期內跨越這些困難,加速自身的成長與成熟周期。
為了實現這個目標,有幾件事非常重要:
1.形成產業共識,避免概念混淆。
提起AI芯片,我們經常會說它有非常多的實現方式,有很多自主品牌參與這個市場,看上去一片繁榮。比如AI芯片有GPU、FPGA、ASIC、存算一體和類腦芯片等,國產AI加速芯片廠商有阿里、百度、華為、寒武紀、海光信息、燧原科技、天數智芯、壁仞科技、摩爾線程、龍芯中科等。
這種“繁榮”的表述,不僅在大眾輿論和投資市場上具有迷惑性,還經常出現在一些行業報告與政策分析當中。但其中蘊藏的問題在于,普遍過分拓展了AI芯片的定義。比如說,類腦芯片在可見的未來中都僅僅是技術暢想,如果每次討論國產AI芯片都把類腦加上,那只會浪費時間,分散精力。再比如,有些AI芯片廠商只能做自用芯片,無法面向市場出貨。有些廠商目前還不具備商業化能力,處在早期建設階段,他們短期內對于AI計算自主化的貢獻也就非常之小。
為了應對英偉達高端GPU禁售問題,我們需要把目光集中在可行、有效的GPU替代品上,而不是進行過多聯想和發散。只有形成了這一產業共識,才能聚集力量解決問題。
2.走向規模化商用,避免PPT造芯。
事實上,無論從AI加速芯片還是服務器整機來看,國內目前能夠出貨的AI芯片廠商都寥寥無幾。主要集中在華為、百度兩家,燧原科技、海光信息也有一定的出貨。而大量半導體廠商與AI企業,更多還停留在打造芯片的計劃與愿景上。這就導致大量受到政策支持與投資市場期待的國產AI芯片停滯不前,甚至有停留在這一階段享受金融市場紅利的嫌疑。
接下來的產業導向,應該從AI芯片的立項走向出貨,幫助AI芯片廠商獲得直接的商業回饋,產品與產能接受市場檢驗,逐步塑造正向的現金流。
3.加強軟件生態,強化遷移能力。
英偉達GPU之所以重要,不僅在于硬件性能,更在以CUDA、PyTorch為核心的軟件生態能力,因此發展國產AI芯片絕不能低估軟件的能力。在強化自主軟件生態建設的同時,也要重視基于英偉達生態打造AI模型的遷移能力與遷移成本。
為此,已經有大量廠商進行了探索,比如海光信息的DCU,就在生態、編程環境等方面與CUDA高度相似,CUDA用戶可以以較低代價快速遷移至海光的ROCm平臺。而在此前,PyTorch2.1 版本宣布支持華為昇騰。可見國產AI芯片已經具備了一定的規模化影響力,可以更多融入全球軟件生態當中。
未來想要實現國產AI計算的爆發,是無法離開國產AI基礎軟件生態爆發的。
4、加大對“主品牌”支持,形成規模化效應。
對于美國AI芯片,除了英偉達GPU,你還知道哪些?這個問題即使是問一些AI開發者,答案也很大程度是不清楚,或者沒試過。從中可見,AI計算就像通用計算、圖形計算一樣,極大概率是會最終出現一到兩個“主品牌”的。這屬于客觀的市場規律,沒有必要以揠苗助長的方式實現“百花齊放”的局面。
甚至就目前中國AI計算必須加速成熟,完成自主化替代的目標來說,盡快實現一超多強的局面是件好事。這可以避免生態割裂,避免產業在搖擺形成大量IT投資浪費。這個過程理應交給市場選擇,慢慢成型。但在芯片禁令的大背景下,國產AI計算崛起已經時不我待,與其讓100種AI芯片慢慢成熟,慢慢洗牌,比如加速形成“主品牌”快速替代的局面。
而從目前局面看,昇騰是最有可能成為國產AI算力主品牌的一支力量。科大訊飛創始人、董事長劉慶峰此前表示,華為GPU已經對標英偉達A100。根據數據顯示,昇騰310整數精度算力達到了16TOPS,昇騰910整數精度算力達到640TOPS。這意味著昇騰910性能已經接近英偉達A100。
同時,昇騰也是目前唯一穩定占據市場份額的國產AI算力,并且在軟件上孵化了類似英偉達CUDA的異構計算架構CANN和AI計算框架MindSpore。在核心性能、軟件生態與市場占有率三項指標來看,昇騰都已經具備了可以加快成長,實現AI算力大規模國產化替代的可行性。
規范行業標準,強化軟件建設,提高自主品牌支持,是短期內推動國產AI算力快速成長的主要途徑。
英偉達禁令,是一個中國AI行業普遍不愿意看到,盡量避免,甚至到今天也有些諱莫如深的問題。但形勢比人強,在不斷加速的逆全球化進程與AI競賽中,類似禁令未來大概率只多不少。
逃避、迂回、噤若寒蟬,都無法解決問題,只有坦然應對,奮力自強,才能從根本上解決受制于人的問題。
禁令之下,中國AI計算何去何從?
答案是我們已別無選擇,所以要給世界第二個選擇。
-
gpu
+關注
關注
28文章
4743瀏覽量
128984 -
AI
+關注
關注
87文章
30985瀏覽量
269271 -
英偉達
+關注
關注
22文章
3778瀏覽量
91179 -
AI芯片
+關注
關注
17文章
1888瀏覽量
35058
發布評論請先 登錄
相關推薦
評論