哪些公司在做大模型?面對這個問題,我們首先會想到大型互聯網公司和AI創業公司。他們更多是做大模型算法本身,以及圍繞大模型的上層應用。
但順著這條產業鏈向下看,卻會發現在AI芯片與AI算法之間,還有非常關鍵的一層,這就是IT層。圍繞AI大模型的爆發,產生了一系列存、算、網等IT設備升級,以及AI數據中心、私域大模型的市場需求。這些需求持續上漲,帶來了IT行業的又一次爆發。
所以,當我們在討論大模型產業鏈的時候,不能離開IT行業與IT企業。從2023年到現在,可以看到各個主要IT廠商紛紛出牌,搶灘大模型的新機會。這種趨勢將在2024年持續上升,產生更加激烈的市場競爭。
IT大廠面對大模型,首先是做產品,找切口,繼而開始形成連貫的智能化戰略。
本文中我們希望和大家一起讀懂,IT企業為何要搶灘大模型,又是如何實現這一戰略目標的。
走向第三春:大模型帶來的IT市場迭代
AI大模型的爆發,客觀上給IT企業帶來了巨大的機會。這是由于傳統的IT設備,大多數都無法滿足AI大模型的訓練與部署需求。其中最知名的,就是AI需要專項算力。于是就產生了AI服務器這個全新的IT市場。再比如集群化AI訓練,需要對數據中心的網絡設備進行全面升級,以此來避免珍貴的AI算力在集群化過程中被浪費。
這些由大模型特殊性產生的IT設備迭代需求,伴隨著AI技術的爆發給IT市場格局帶來了顯著影響。比如,根據TrendForce此前發布的數據,2023年全球AI服務器(包含搭載GPU、FPGA、ASIC等)出貨量應該可以達到120萬臺,年增長率高達38.4%,并且市場規模上將占到整體服務器市場出貨量的近9%。
如果這種情況持續下去,AI技術專項適配的IT設備,既是目前階段的增長爆發點,也可能是未來市場的主流需求。因此沒有IT廠商可以放棄大模型帶來的戰略契機。
回溯IT市場的發展歷史,行業內經常將過去劃分為早期IT市場的信息化時代,以及互聯網興起之后的數字化時代。那么伴隨著AI大模型的全面滲透,市場很可能將迎來IT第三春,也就是智能化時代。
在智能化契機的序曲當中,還有一條不能忽視的主線,那就是IT技術的國產化。尤其在2023年,伴隨著AI芯片禁令的反復炒作,AI算力國產化成為科技自主可控趨勢中的重中之重。
國產化意味著新需求。這一需求與AI大模型帶來的市場需求交融在一起,加重了這一輪IT市場迭代的分量。
面對走向IT第三春的可能,各個廠商紛紛開始尋找自己的AI市場切入口,同時注重提升自主可控AI產品的占比。
而分析IT廠商實現這一目標的戰略,我們可以將其歸納為以下三種。
以高度,贏廣度
IT廠商在切入大模型機遇時,首先要解決客戶信任的問題。AI相關的IT基礎設施選擇很多,且差異化較小,用戶試錯成本巨大。所以如何能夠與客戶建立技術及解決方案信任是關鍵。
破解這個難題,有這樣一種思路:廠商首先來把最核心、最難的事情完成,再通過核心市場來影響普及市場,形成以高打低,以高度贏廣度的市場格局。
而AI領域的核心任務有兩個。最復雜、龐大的基礎設施是AI計算中心,而最復雜的AI任務是AI for Science。
而在這兩個維度布局最深,并且已經贏得口碑的,應該是中科曙光。
AI for Science為代表的“重型AI”需求,具有算力規模大、多元算力融合、服務需求水平高的一系列特點。為了切入這個領域,早在2022年曙光就完成了算力一體化平臺的開發及布局。依托各類算力中心,以原生的底層資源、市場化運營機制、開放生態體系,以及大量增值服務為支撐,為用戶提供集“算力、數據、應用、運營、運維”的一體服務。
這一戰略的代表性成果,就是曙光推出的5A級智算中心。在智算中心場景中,需要集中呈現廠商的技術、資源、生態、產學合作等AI行業要素。需要完成從技術投入到解決方案構建,再到運營支持、生態建設的一系列工作。因此在東數西算背景下,能夠獲得大量認可的智算中心,就會成為整個智能化IT生態中的戰略高地,滿足更多用戶對廠商AI技術能力與生態能力的信任。
陸續建設并投入使用的5A智算中心,也就成為曙光在切入AI機遇時的高點。廣泛帶動了曙光在AI服務器、存儲等領域的發展。同時,曙光在AI for Science的積極布局與成功經驗,也成了其持續挺進AI機遇時的核心差異化要素。
目前來看,“以高帶廣”是IT廠商走進智能時代一個行之有效的策略。
以算法,帶設備
相較于互聯網企業與AI公司,更多有IT需求的企業其實并不了解AI,同時也很難探索滿足自身業務需求的大模型落地方案。這也就導致更廣泛的客戶難以向AI方向轉化。為了解決這個問題,在2023年我們看到了IT廠商開啟了一種比較超越常規的探索:自己做AI大模型,并且開源。
去年11月,浪潮信息對外發布了完全開源且可免費商用的源2.0基礎大模型。這個系列的AI大模型包含1026億、518億、21億等不同的參數規模。對外稱為是國內首個千億參數、全面開源的大模型。在能力應用上,源2.0大模型可以執行多種任務,比如數理邏輯、代碼生成、知識問答、中英文翻譯、理解和生成等。
作為硬件供應商的IT企業,去做純軟件的開源大模型,似乎是一件打破常規的事。但在浪潮信息的動作中,我們卻可以看到這個策略在“打開AI機遇切口”上的合理性。
首先,訓練大模型的基礎是硬件能力,尤其是算力能力。同時也會展現出廠商對軟硬件適配能力的理解。比如說在算力層面,源2.0就采用了非均勻流水并行的訓練方法,綜合運用“流水線并行+優化器參數并行+數據并行”的策略,讓模型在流水并行各階段的顯存占用量分布更均衡,避免出現顯存瓶頸導致的訓練效率降低的問題。這個方法為硬件差異較大的環境提供了新的訓練方式。這樣的經驗展現、路徑探索,可以幫助IT廠商更緊密了解客戶的IT環境與AI訓練需求,從而提供準確的產品及服務。而對于用戶來說,先看懂廠商如何做算法,也可以有效指導自身的AI算法嘗試,從而可以推動嘗試與客戶間的AI合作關系。
另一方面,IT廠商推出開源且可免費商用的大模型,等于將大量潛在客戶的算法應用門檻降到最低,讓他們可以開始嘗試大模型。而在嘗試成功之后,客戶也自然會更傾向于開源模型背后,原廠提供的IT設備,從而實現了以軟件帶動硬件的市場策略。
這種策略能否收獲積極的市場反饋,在2024年引起行業的效仿和跟隨,讓我們拭目以待。
以全棧,降門檻
在IT行業中,企業需要堅持產品和解決方案兩條腿走路的策略。前者主攻出貨量,而后者可以帶來更為可觀的利潤空間。
而在AI大模型機遇到來時也是如此。相對來說,本身AI能力較強,應用相對成熟的企業會考慮購買AI相關的存、算、網IT產品。但更多的企業則沒有強大的AI能力,但又對智能化能力有著需求和期待。這種情況下,就需要IT企業以解決方案的模式進行AI能力交付,從而降低企業的AI大模型門檻。
這也就引出了IT廠商入局大模型的第三種思路:發揮自身的全棧技術優勢,提升解決方案交付能力。在降低企業AI應用門檻的前提下,獲得更好的商業回饋。
這一點,可以說是IT廠商面對大模型機遇時的普遍選擇。各家都是重兵投入,集結力量。一般來說,AI大模型相關的硬件設備有算力、存儲、網絡和商用終端,而在硬件基礎上還有AI開發平臺、管理平臺、私域大模型等軟件能力。在這各個領域有廣泛布局的IT廠商,也就有了擁抱大模型機遇的更大底氣。
比如說,新華三面向AI大模型機遇,打造了百業靈犀LinSeer私域大模型,定位是為企業用戶提供定制化服務的私域大模型。可以提供資料分析、代碼編寫等服務,覆蓋了政府政務、工業制造等諸多領域。百業靈犀LinSeer私域大模型,可以與新華三此前的一系列AI布局進行結合,比如訓練型智算服務器、推理型智算服務器、綠洲平臺、傲飛算力平臺、無損網絡,高性能存儲、液冷解決方案等,能夠綜合性幫助客戶一站式部署智算底座,快速搭建AI場景化應用。
這種盡量發揮自身全棧技術優勢,打通AI大模型所需軟硬件底座的模式,在很多IT廠商的最新動作中都有展現。比如聯想推出的大模型解決方案及服務,就包括智算中心、AI平臺、AIforce的“三位一體”。面向私域大模型市場,聯想也推出了幫助企業構建私有化大模型平臺的服務,其依托于一站式端到端的解決方案與陪伴式服務,讓客戶不必考慮部署細節,就可以快速獲得大模型能力。這一解決方案的建立,也融合了聯想在IT基礎設施、IT服務、AI force平臺,以及智能終端領域的多種能力。
這種盡量將自身產業優勢結合,形成整體性解決方案,從而提供低門檻AI獲取方式的能力,是IT企業切入大模型機遇核心策略。比如我們可以看到新華三在切入大模型領域時,就將自身在網絡、液冷等方面的優勢融合進來。而聯想則將自身在商用終端、AI能力平臺上的積累納入整體方案。
這種通過能力融合來構建差異化的策略,將在接下來IT廠商布局AI業務時展現得更加清晰。
整體來看,IT廠商搶灘大模型,是一種綜合能力的考驗,同時也需要廠商有調動、整合的能力,從而實現高舉高打的系統性戰略。
在這個過程中,有三個要素尤為關鍵。
一是廠商能否將多元化的布局協同起來,通過能力整合發揮出自身獨特的AI優勢。
二是能否實現軟件側對硬件側的補充,甚至通過軟件創新反哺IT基礎設施市場。
三是技術自研以及全面國產化的能力,這點將在科技自主可控的浪潮中不斷變得更加重要。
可以說,IT行業的AI迭代與智能化競賽,才剛剛拉開序幕。
審核編輯 黃宇
-
AI
+關注
關注
87文章
30728瀏覽量
268886 -
算力
+關注
關注
1文章
964瀏覽量
14793 -
AI服務器
+關注
關注
2文章
104瀏覽量
4894 -
大模型
+關注
關注
2文章
2423瀏覽量
2641
發布評論請先 登錄
相關推薦
評論