競爭驅(qū)動洗牌,洗牌催生跨越。
我們深知,適應(yīng)比預(yù)測更重要。無論是如今寫在歷史中的大公司們,還是依舊尋找方向的創(chuàng)業(yè)公司,無一例外不經(jīng)歷著一次又一次的洗牌,又在一次又一次的洗牌中或退場、或重生。
這是一個洗牌年代,也是一個值得書寫的年代。
2024年注定是AI芯片廠商們捉對廝殺的一年。
過去一年時間里,AI賽道烈火烹油,以英偉達為代表的GPU廠商手握算力心臟,背靠AI企業(yè)擴大云計算規(guī)模和訓練大模型的需求,吃下了AI時代的第一筆紅利,賺得盆滿缽滿。
隨著時間來到2024,AI從云端蔓延向終端,「AI+產(chǎn)品」概念下的許多新物種逐漸走到消費級的臨界點。為了捕捉這些增長點,雄踞于各個細分領(lǐng)域的AI芯片龍頭紛紛開啟了跨界合作,一手推出新品,一手尋找新的合作伙伴。
即便是確定性相對較強的云端算力市場,也透著一股「山雨欲來風滿樓」的氣息。谷歌、微軟、亞馬遜先后宣布推出或計劃推出自研AI芯片,AMD的新產(chǎn)品MI300X在性能上緊咬英偉達H100,英特爾CEO基辛格透露:“整個行業(yè)都被推動來減少CUDA(英偉達推出的運算平臺)的市場。”
2024,AI芯片市場的格局將迎來什么變化?而這潑天富貴,又將花落誰家?
云端之戰(zhàn):英偉達如何對抗圍剿?
從云端需求和企業(yè)動作來看,2024年研發(fā)下一代大模型仍將是各大科技公司競爭的核心,其中多模態(tài)模型占比逐漸提高的趨勢帶動了更大的算力需求。
C端AI應(yīng)用數(shù)量的增加也為云市場的增長注入了穩(wěn)定性。過去,模型的預(yù)訓練是GPU消耗最大的環(huán)節(jié),大約80%,但隨著越來越多的消費者開始調(diào)用模型進行推理,未來推理和訓練的算力占比將倒置。晚點LatePost報道,多位大模型從業(yè)者估算,如果千億參數(shù)或更大的人工智能模型被廣泛使用,大模型的訓練成本和推理成本會達到2:8,甚至1:9。
對AI創(chuàng)業(yè)者以及科技巨頭來說,這個消息憂喜參半。
2023年,所有涌向AI的掘金者都對上游芯片供應(yīng)商有一種復(fù)雜的情緒。研發(fā)AI產(chǎn)品離不開AI芯片這顆算力心臟,但高昂的價格和短缺的產(chǎn)能同時也令他們無時無刻不被焦慮包圍。
除了恐懼拿到芯片的同行領(lǐng)先自己在市場上鋪開業(yè)務(wù),更擔心賣方市場的格局仍將持續(xù)下去,無法擺脫向上游「納稅」的命運。
但令人意外的是,這些賺得盆滿缽滿的賣水人同樣不安。GPU龍頭英偉達創(chuàng)始人黃仁勛在去年十一月的一場演講中表示:“我們不需要假裝公司一直處于危險之中。我們(確實)一直處于危險之中。”
黃仁勛在AI的暴風眼站了一年,這句話大概是他的真實感受。
壓力首先來自于同行競爭。
作為市場上唯一有希望在GPU領(lǐng)域挑戰(zhàn)英偉達的企業(yè),AMD每次發(fā)布新芯片,英偉達都會被拿出來做對比,你甚至可以在去年12月的多輪交鋒中看到火花迸射。
AMD12月6日推出MI300x時,宣稱表現(xiàn)優(yōu)于英偉達的AH100。英偉達隨后發(fā)布了自己的基準測試作為回應(yīng),表明AH100在正確的設(shè)置下仍然更好。AMD再次對此做出回應(yīng),發(fā)布了新的基準測試,再次顯示MI300X在正確的設(shè)置下表現(xiàn)出色。
此外,英特爾雖然在GPU領(lǐng)域鮮有建樹,但仍未放棄這塊甜美的蛋糕。英特爾聲稱,將在2024年上市的Gaudi 3,性能超過了英偉達的AI芯片H100。
除了同行,英偉達的客戶們也并不忠誠,谷歌、亞馬遜、特斯拉、阿里、百度、微軟……幾乎所有的大客戶都宣布將自研AI芯片。
這些客戶還對英偉達的生態(tài)護城河發(fā)起了猛攻。“整個行業(yè)都被推動來減少CUDA的市場”,英特爾CEO基辛格最近公開表示,MLIR、谷歌和OpenAI等都在轉(zhuǎn)向一個“以Python語言為基礎(chǔ)的編程層”,以使AI訓練更加開放。
自研芯片和生態(tài)建設(shè)并非易事,為何反倒成為了行業(yè)共識?英偉達的「鐮刀」實在太鋒利了。
《財新》的一篇報道中顯示,哪怕花英偉達同樣的成本,只要做出十分之一的效果,這些科技廠商便已經(jīng)有利可圖。更具體的案例是,按照谷歌的報價,使用其最新的AI芯片TPUv5e在訓練、推理參數(shù)少于2000億的大模型時,成本低于用A100或H100。
英偉達搶客戶的行為也讓云廠商難以接受。去年3月GPU最稀缺的時候,英偉達推出云計算服務(wù)DXGCloud。簡單來說就是把賣給云廠商的GPU再租回來,進一步優(yōu)化后再出租給需要GPU算力的客戶。一來一去,云廠商承擔了數(shù)據(jù)中心的建設(shè)成本,但客戶卻去了英偉達。
對英偉達來說,最大的變量可能還是在中國。近日外媒的一篇報道顯示,由于對華出口芯片的性能被一壓再壓,中國玩家正在對其失去興趣,這意味著它可能失去接近五分之一的營收。
當然,作為硅谷最具戰(zhàn)斗精神和固執(zhí)的企業(yè)之一,坐以待斃從來不是英偉達的風格。過去的一年里,憑借占市場份額接近95%的最大GPU賣方身份,英偉達的護城河其實被拓寬了。
英偉達的核心競爭力主要由三個板塊構(gòu)成——供應(yīng)鏈優(yōu)勢、軟硬件生態(tài)、投資。
軟硬件生態(tài)方面,預(yù)計2024年出貨的AI芯片H200及生態(tài)配件,仍是市場上最適合大模型生長的「土壤」。而投資方面,2023年英偉達完成了20多筆投資,投資版圖涵蓋AI相關(guān)的各個行業(yè),即便未必能從中穩(wěn)定獲利,過程中積累起的KnowHow,也將逐漸成為其它初創(chuàng)企業(yè)選擇英偉達的理由。
真正決定2024年市場格局的,是英偉達的供應(yīng)鏈優(yōu)勢。
AI芯片產(chǎn)業(yè)鏈冗長、復(fù)雜,每個細分領(lǐng)域都有各自的領(lǐng)頭企業(yè),只有將它們集成到一起,才能生產(chǎn)出性能最好的芯片。
英偉達籠絡(luò)它們的手段是承諾不可取消的訂單。目前,英偉達有111.5億美元的采購承諾、產(chǎn)能義務(wù)和庫存義務(wù),另外還額外簽訂了價值38.1億美元的預(yù)付費供應(yīng)協(xié)議。這些被承諾的訂單中包含臺積電近六成產(chǎn)能和SK海力士、三星、美光HBM的大部分供應(yīng)。
臺積電封裝對芯片性能的影響無須多言,HBM同樣關(guān)鍵。HBM是高帶寬內(nèi)存芯片,而GPU只有內(nèi)存足夠大、數(shù)據(jù)傳輸速度足夠快,才能保證運行效率。
單從這方面看,沒有其他供應(yīng)商可以與之相媲美,因此他們也將無法參與正在發(fā)生的狂熱AI浪潮,即便是谷歌等科技巨頭。
綜上所述,2024年的云端戰(zhàn)事確定性較強,雖然英偉達遭遇圍剿,但無論是自研芯片還是生態(tài)建設(shè)都需要時間來慢慢發(fā)酵,至少在供應(yīng)鏈緊張的問題解決之前,英偉達的統(tǒng)治地位不會被動搖。
場景之戰(zhàn):AI PC、 AI Car 、AI Phone成最熱板塊
淘金先富賣鏟人,背后的AI芯片廠商已經(jīng)摩拳擦掌。分行業(yè)來看,AI PC、AI Phone、AI Car是其中關(guān)注度最高的三個板塊。
AI Phone:亟待AI拉動新增量
過去幾年時間里,手機處于增長乏力的狀態(tài),即便廠商在硬件上「卷」到了極致,仍難以掩蓋創(chuàng)新缺失的殘酷真相。除了華為mate 60橫空出世給市場帶來了一些新鮮血液,就連蘋果的發(fā)布會都難以講出說服消費換機的新故事。
AI是它唯一能拉動增長的發(fā)力點。「AI上機」的傳說從ChatGPT向C端開放起就飄蕩在市場的上空,被談?wù)摿艘徽辍5诖竽P拖蛐⌒突l(fā)展之前,硬件與模型規(guī)模之間的矛盾幾乎不可調(diào)和。
事實上在手機端,至今也很難在保證模型性能的情況下,避免手機發(fā)熱、內(nèi)存占用量過大等體驗對消費者購買欲產(chǎn)生的影響。
年初,手機芯片雙雄之一高通演示了在安卓上運行Stable Diffusion的效果,并在近期宣布將推理時間縮短到1秒以內(nèi),但另一雄的聯(lián)發(fā)科工程師表示,本地運行13B體量的小模型就意味著需要占用約13GB的內(nèi)存,再加上安卓本身的4G,在不下載任何其他App的情況下,就已經(jīng)超過了大多數(shù)手機16GB的內(nèi)存容量。
即便如此,市場仍為AI Phone領(lǐng)域的增長投下了贊成票。它們的理由是,手機是人們?nèi)粘J褂妙l率最高的電子產(chǎn)品,基于入口優(yōu)勢,雖然本地部署還存在一定的困難,但云端運行AI帶來的增量仍不容忽視。分析機構(gòu)Canalys預(yù)測,2024年全球智能手機出貨量將在2024年恢復(fù)增長,增幅約為4%。
AI PC:硬件、框架之爭
相比之下,AI PC的進展則順利得多。理由也很簡單,與手機相比,PC的體積更大,芯片性能的上升空間更廣。IDC預(yù)測,2024年將成為AI PC快速發(fā)展的第一年,2024年整體PC市場AI PC占比將達到55%,而2027年將達到85%。
目前PC端的AI芯片廠商已經(jīng)釋放出了濃烈的火藥味,彼此間的混戰(zhàn)一觸即發(fā)。
NPU與GPU之爭是混戰(zhàn)的第一個賽點。
GPU無需多言,關(guān)鍵是NPU為什么能站上擂臺。與算力中心背靠成千上萬臺集成了CPU、GPU等各種芯片的服務(wù)器不同,PC的算力主要集中在一塊「總芯片」當中,這塊芯片由CPU、GPU、NPU等「分芯片」構(gòu)成,各芯片分工不同。其中NPU就是專門被設(shè)計出來處理AI相關(guān)運算任務(wù)的。
因此,矛盾產(chǎn)生了。雖然GPU的定義是圖形處理器,但同時它浮點、并行運算的特性也促使它成為了運行AI運算的最佳載體之一,這一點在云端已經(jīng)被證明。一旦AI PC實現(xiàn),大量AI運算任務(wù)勢必帶動GPU的銷量。本次CES展開幕之前,英偉達連發(fā)三款消費級GPU,顯然是向市場釋放信號。
X86構(gòu)架和ARM構(gòu)架之爭,是混戰(zhàn)的第二個賽點。
X86和ARM是芯片的兩種構(gòu)架。X86構(gòu)架是英特爾的代名詞,在PC芯片端,直接與英特爾展開競爭的是采用ARM構(gòu)架的手機芯片龍頭高通和聯(lián)發(fā)科。
X86和ARM的區(qū)別可以簡單概括成前者性能、功耗雙高,后者雙低。過去,ARM一般被用于手機,但近年內(nèi),隨著ARM芯片的性能不斷提高,低功耗的優(yōu)勢正在引起業(yè)內(nèi)玩家的注意。微軟、蘋果、Meta等廠商都在支持基于ARM的PC。據(jù)界面新聞報道,英偉達和AMD正在考慮2024年為移動PC提供基于ARM的解決方案。
高通對于AI PC垂涎已久,去年10月面對Windows 11發(fā)布的驍龍X Elite芯片與同級X86相比,性能可達競品的兩倍,而達到相同峰值性能時,功耗僅為競品的三分之一。
AI Car:兩大陣營跑馬圈地
雖然AI PC的戰(zhàn)場已經(jīng)硝煙四起,但若是與AI Car相比,甚至能被稱作一團和睦。背后的原因也很好理解,PC和手機是為存量市場里找增量,而車載AI則是實打?qū)嵉乃{海。
在智能座艙領(lǐng)域,高通率先采用SoC邏輯設(shè)計車載MCU芯片的舉措為它帶來了先發(fā)優(yōu)勢,因此扮演著守城者的角色。眼下,它正面臨著英偉達、聯(lián)發(fā)科、英特爾等企業(yè)的多重圍攻。
去年6月,聯(lián)發(fā)科宣布將與英偉達合作,為下一代軟件定義汽車提供全套車載人工智能座艙提供解決方案,覆蓋從豪華到主流的所有汽車細分市場。
雙強合作的模式是,聯(lián)發(fā)科將開發(fā)集成英偉達GPU的汽車SoC。而英偉達則是目前高端車型主要采用的自動駕駛系統(tǒng)供應(yīng)商,客戶資源廣泛。本次CES展中,英偉達公布了DRIVE系列汽車業(yè)務(wù)的最新進展,理想、長城、極氪、小米等企業(yè)均已采用DRIVE Orin平臺為其智能自動駕駛系統(tǒng)提供支持。
英特爾亦在CES宣布了進軍汽車行業(yè)的重要戰(zhàn)略,推出專為下一代汽車設(shè)計的AI增強軟件定義車輛系統(tǒng)芯片(SoCs)。其旗下的自動駕駛解決方案公司Mobileye一直處于世界領(lǐng)先的地位。
在自動駕駛領(lǐng)域,則呈現(xiàn)兩強爭霸的格局。英偉達與地平線分別包攬高端和低端車型,按覆蓋車型價格區(qū)間的廣度排名,地平線第一,英偉達第二。
與英偉達CUDA類似,地平線也有自己的生態(tài)護城河。同時,作為本土供應(yīng)商,地平線在交付效率上更具優(yōu)勢。
格局之戰(zhàn):2024,誰是最關(guān)鍵的變量?
各家芯片廠商在AI PC、AI Phone、AI Car卷出天際,在這個堪比「春秋戰(zhàn)國」的新競爭時代,即便英偉達依舊遙遙領(lǐng)先,一些關(guān)鍵問題也隨之而來:2024年,誰能殺出重圍?誰又是英偉達之外最關(guān)鍵的變量?
毫無疑問,這將是一場格局之戰(zhàn)。我們可以從蛛絲馬跡中對2024年誰將殺出重圍做出一些預(yù)判。
雖然三大熱門場景都有變化,但增量的絕對值不盡相同。綜合硬件性能、用戶需求、市場規(guī)模等因素,「硅基研究室」判斷,AI Car會是增量最大的領(lǐng)域,AI Phone次之,AI PC最末。
車端可能是2024年最撲朔迷離的AI芯片戰(zhàn)場。
市場上玩家布局的路線主要可以歸納成兩條。一條從自動駕駛出發(fā),向智能座艙拓展,譬如英偉達和Mobileye(通過英特爾實現(xiàn))。另一條則是從智能座艙出發(fā),向自動駕駛拓展,譬如高通。
在智能座艙領(lǐng)域,眼下市場上各家新能源車企的競爭,與其說是芯片性能之爭,不如說是對用車場景的理解之爭。而在自動駕駛領(lǐng)域,因為和安全息息相關(guān),必須要保證硬件運行的穩(wěn)定性,并且需要經(jīng)過市場驗證,領(lǐng)先玩家具備更高的壁壘。
從這個角度出發(fā),英偉達、Mobileye將率先受益,地平線等二線廠商有望憑借低成本、高成熟度的產(chǎn)品成為車企的替代方案。
但是,如果將視角切換到交付的穩(wěn)定度和市場鋪開面上,則是地平線、華為等國產(chǎn)玩家具備更強的潛力。
一方面,在地緣政治背景下,AI芯片的對華出口能否持續(xù)、穩(wěn)定,需要畫一個問號。性能和生態(tài)固然是一道門檻,但正在解決當中。
另一方面,雖然目前地平線主要在低端車型中鋪開,但企業(yè)在自動駕駛領(lǐng)域的發(fā)展高度依賴數(shù)據(jù)積累,未來以更快的速度對先進廠商完成反超也并非沒有可能。
在手機領(lǐng)域,AI芯片廠商享受紅利的前置條件是大模型本地部署。
眾所周知,大模型上機有兩種模式,一種是云端接入,另一種是終端部署。前者靠將用戶的訴求反饋至云端,運算后在將結(jié)果發(fā)回手機。后者全流程均依靠本地硬件完成。
從能實現(xiàn)的功能上來看,兩者類似,唯一對消費者購機意愿影響較大的因素是“是否愿意將本地數(shù)據(jù)(包括照片、文件、對話記錄)上傳至云端”。從這一點出發(fā),本地部署確實存在需求,手機AI芯片的增長值得期待。
那么高通和聯(lián)發(fā)科誰能將占據(jù)領(lǐng)先地位呢?
從市場站位來看,高通和聯(lián)發(fā)科分別占據(jù)高端和中低端手機市場,向上突破的難度遠大于向下兼容,并且目前推出AI手機的廠商均將價格定位在高端。
高端的市場站位給高通帶來了更豐厚的毛利率,對比財報來看,高通第三季度的毛利率約為55.1%,聯(lián)發(fā)科毛利率水平為47.4%,這意味著高通有更多的「余錢」來推動研發(fā)。滾雪球效應(yīng)下,恐怕聯(lián)發(fā)科想要追趕高通仍有一段路要走。
值得一提的是,蘋果和華為的AI芯片計劃也會對市場格局產(chǎn)生影響,但程度較輕。
近年來,蘋果手機芯片的性能提升幅度與高通、聯(lián)發(fā)科等競爭對手相比均不占優(yōu)勢。不久前登場的兩大安卓芯片——高通8 Gen3以及聯(lián)發(fā)科天璣9300,在CPU多核性能、CPU多核能效比、GPU峰值性能、GPU能效比等核心技術(shù)指標上均已領(lǐng)先同時期的蘋果A17 Pro。
華為方面,受到地緣政治因素影響,目前在芯片性能方面還難以和國際一流芯片廠商掰手腕。
在PC端,雖然近日AI PC的聲量不小,但距離它真正撬動C端市場的銷量,還需要一些時日。
從C端場景出發(fā),可以大致將AI應(yīng)用區(qū)分為辦公和娛樂兩大類。
辦公場景中,雖然微軟、金山辦公、Midjourney、Adobe等軟件已經(jīng)將AI功能融入其中,但它們的推理任務(wù)主要還是由云端負擔,并且已經(jīng)形成了按次付費的商業(yè)模式,不需要本地硬件具備太高的性能。
在娛樂場景中,在AI熱興起之前,為了支撐游戲流暢運行,本身就對GPU為代表的圖形處理能力有較高的要求。按照眼下能被「塞」進PC的模型規(guī)模,過去用于渲染游戲畫面的GPU,完全有充足的算力支撐AI衍生應(yīng)用運行。
仍以英偉達為例,雖然在本次CES揭幕之前發(fā)布了三款新的消費級GPU,但三款GPU的性能均未超越2022年發(fā)布的RTX 4090。
綜上所述,2024年,在云計算等傳統(tǒng)領(lǐng)域,英偉達得益于供應(yīng)鏈優(yōu)勢等護城河,最值錢的賣水人地位短期內(nèi)不會發(fā)生改變。
而在AI PC、AI Phone、AI Car三大場景中,分別在技術(shù)和渠道方面占據(jù)優(yōu)勢的英偉達和地平線將率先吃到AI Car的紅利,而高通有望在亟需新故事拉動增長的AI Phone品類殺出重圍,至于AI PC,在新場景和新工作范式出現(xiàn),并帶動更強的硬件需求之前,相關(guān)企業(yè)的市場份額及銷量還有待觀察。
2024年是AI芯片廠商迎來潑天富貴的一年,但同時,也能感受到水面之下醞釀著激烈的變化。企業(yè)和投資者當然可以投身這片藍海,但最好時刻保持警惕。
審核編輯:黃飛
評論
查看更多