如果有人問,AI大模型行業,最近的風向是什么?相信很多人都會說,是“內卷”。
近段時間,“降價”成了大模型的第一關鍵詞。各大云服務商爭相加入AI降價潮,甚至有公司模型降價達到了97%的驚人幅度。加上廠商搶卡、模型開發者套殼,種種痕跡似乎印證著AI大模型迎來了極度“內卷”的新風向。
但是,這種“內卷”的盡頭一定是不健康的。原因很簡單,我們只需要問目前的產業形態幾個問題:大模型的核心技術成長了嗎?大模型落地應用更容易了嗎?產業中那些棘手的問題解決了嗎?如果答案都是否定的,那么以降價和內耗為代名詞的內卷之路,前途注定是灰暗的。
然而任何風潮中也總有逆行者。與同質化內卷相對應的,是AI大模型領域也潛藏著反內卷的力量。去解決問題,去做實事的反內卷AI之路,雖然更難,但卻更有必要。在HDC 2024,我們就看到了一朵逆行的云,一條逆行的AI之路。
(華為常務董事、華為云CEO張平安)
6月21日,華為開發者大會 2024(HDC 2024)在東莞籃球中心揭幕。期間,華為常務董事、華為云CEO張平安發布了盤古大模型5.0,在全系列、多模態、強思維三個方面全新升級。同時,張平安還分享了盤古大模型在自動駕駛、工業設計、建筑設計、具身智能、媒體內容生產和應用、高鐵、鋼鐵、氣象等領域的豐富創新應用和落地實踐,持續深入行業解難題。此外,華為諾亞方舟實驗室主任姚駿、華為云CTO張宇昕分別就盤古大模型5.0訓練過程解密和華為云全棧系統性創新發表主題演講,詳細解讀華為云在AI領域的全棧創新。
從發布盤古5.0,到展示包括AI原生基礎設施、AI開發平臺在內的AI全棧創新,我們能夠看到華為云選擇了做AI大模型領域最難的事,把AI能力從紙面引到真實的生產場景中來。這種行動方案,可以總結為用技術能力的外溢,反對零和博弈的內卷。
以前有句歌詞,叫做“走的是人間的道,扛的是頂風的旗”。
想要AI走人間的道,需要云廠商扛起頂風的旗。
AI大潮前:順風內卷,還是逆風扛旗?
目前階段,AI大模型技術已經成為各國競爭的科技戰略高點,同時也成為科技企業通向下一個時代的船票。全球范圍內,可謂無地不AI,無行業不AI。
但在熱潮之下,一系列由過快增長帶來的“內卷”現象卻表現得淋漓盡致。
首先,各大云服務商掀起了大模型價格戰,以非常不健康的降價模式期望短期內聚攏用戶,實現行業競爭的目標。在這背后,是大模型難以真正走入企業應用,不能解決實際的產業問題,進而導致商業空間受限,云廠商不得已轉向以低價換規模的策略。
其次,在大模型降價的態勢下,廠商能夠投入的技術研發能力越來越少,變成了惡性循環,導致出現了大量以開源模型相互套殼等不良競爭現象。這些極端現象所折射的,是模型同質化過高,核心技術缺乏發展路徑,進而出現了不卷能力,不卷應用,只卷面數據和價格現象。
此外,整個中國AI產業面對著AI算力供應短缺,AI算力基礎設施進口限制不斷加碼的問題。整個產業出現了長期的AI算力荒,亟需可持續供應的自主AI算力。
上游基礎設施不穩定,中間層核心技術不發展,下游產業場景進不去。在這種情況下,AI大模型領域的“順風局”開始變味。似乎大模型不是為了用,而僅僅是為了行業競爭而存在。
這個時候,我們也都知道產業需要一些逆行者站出來,來實際解決全行業面對的共性問題,來引導大模型核心技術與產業需求對齊,通過技術能力外溢的方式來拓展大模型的產業邊界。
想要實現這個“逆行”,就必須把一面旗幟打出來。
這面旗幟,就是AI核心技術的自主創新,是從算力到工具,再到模型和行業場景的全棧AI能力建設。
華為云,選擇逆行于AI行業的“內卷”之風,選擇讓全棧AI的旗幟獵獵作響。
智能要致用:推動盤古5.0升級
大模型內卷嚴重,最核心的問題在于模型能力的高度同質化,而大模型之間的雷同感,問題根源在于缺少升級的方向。大家只能參考海外比較流行的大模型能力,最終導致能力差異化被稀釋。
而華為云在打造盤古大模型過程中的不同之處在于,是他們找到了源源不斷的AI能力升級目標,那就是“用”,是千行萬業的真實的智能化需求。不能讓大模型停留于測試和理念,要讓它走出去,走向行業場景,走向企業需求,然后才能厘清AI的價值是什么,問題是什么,進而找到行之有效的升級之路。
在盤古大模型從3.0到5.0版本的升級過程中,進一步印證了以深入行業場景為目標的大模型升級思路。整體而言,盤古5.0在三方面實現升級:
1.多模態能力提升。
盤古大模型5.0能夠更好更精準地理解物理世界,包括文本、圖片、視頻、雷達、紅外、遙感等更多模態。在圖片和視頻識別方面,可支持10K超高分辨率;在內容生成方面,采用業界首創的STCG(Spatio Temporal Controllable Generation,可控時空生成)技術,聚焦自動駕駛、工業制造、建筑等多個行業場景,可生成更加符合物理規律的多模態內容。
比如盤古5.0可以通過輸入華為公司的年度報表,準確回答華為云的收入和增長情況。通過衛星圖片找到細微的地表變化,通過巨大的病理照片找到我們想要的病菌的數量級。同時,盤古5.0還可以基于多種模態的輸入信息來思考,并且支持將輸入的2D圖片在3D空間中進行推理。
升級多模態能力的核心驅動力,在于真實的行業場景就是多模態的。只有讓大模型看懂物理世界,看懂圖標和數據,在巨大信息中尋求細節,大模型才能真正成為生產中的作業工具,成為能夠沉浸到行業需求中的智能化引擎。
2.全系列模型打造。
在HDC 2024期間,華為終端、鴻蒙操作系統與盤古大模型5.0的結合備受矚目。背后的技術升級在于,盤古5.0推出了不同參數規格的模型,可以適配不同的業務場景。十億級參數的Pangu E系列可支撐手機、PC等端側的智能應用;百億級參數的Pangu P系列,適用于低時延、高效率的推理場景;千億級參數的Pangu U系列適用于處理復雜任務;萬億級參數的Pangu S系列超級大模型能夠幫助企業處理更為復雜的跨領域多任務。
在真實的應用場景中,企業需要在不同類型、不同環境中部署大模型,并且需要進行比較復雜的跨領域協同。盤古5.0的全系列模型打造,也讓其能力進一步深入行業場景,成為更加可用的大模型體系。
3.著重強化思維能力。
盤古5.0還在邏輯推理方面進行了極大升級,將思維鏈技術與策略搜索深度結合,極大提升了數學能力、復雜任務規劃能力,以及工具調用能力。思維鏈幫助智能體(如機器人)更好地理解和預測環境變化,而“策略搜索”是智能體用來適應這些變化并做出決策的過程。兩者共同作用,使得智能體能夠在復雜環境中進行有效地學習和決策。對于真實的生產場景來說,任務往往是復雜多樣,且需要隨時調整的。大模型必須具有足夠復雜的思維推理能力,才能夠真正走向企業的核心生產環節。
總結一下,我們可以發現盤古5.0做了這樣三件事:
適配行業需求,提升AI理解物理世界的核心能力。
適配應用場景,打造多樣化的模型參數規格。
適配企業業務,實現思維推理能力的升級進化。
這些能力都以在真正的行業與企業中“能用”“好用”“有用”為目標,進而來驅動智能化的前進。
張平安強調,一直以來,華為云盤古大模型都堅定的聚焦行業,在解難題、做難事的道路上不斷攻堅克難,砥礪前行,重塑千行萬業。華為云將與所有的客戶、伙伴和開發者一起,創新不止,攀登不止,讓云無處不在,讓智能無所不及,加速千行萬業的智能升級。
久久方為功:扛起全棧創新的旗幟
在模型適配行業場景的同時,企業面對的另一個問題在于基礎設施的薄弱。算力匱乏、工具缺失、基礎設施能力不匹配,每一項缺口都可能造成大模型落地過程中的木桶效應。反而言之,如果云計算廠商不能夠解決這些核心問題,一味“內卷”大模型的價格與紙面上的創新,也只會讓大模型距離真正的商業閉環越來越遠,進而造成技術與應用的脫節。
唯有AI全棧創新,才是大模型發展的正道,也是反內卷的旗幟。
今天的華為云,更加堅定地舉起了這面旗幟,帶來了包括昇騰AI云服務、AI原生基礎設施、AI開發平臺在內的AI全棧創新。
在算力層面,華為云對昇騰AI云服務進行持續優化,打造了貴州、內蒙古和安徽三大核心樞紐,構建了算力一張網,以此滿足全國的算力需求。
同時,昇騰AI云服務可以做到40天萬億參數模型訓練無中斷,遠超業界普遍水平的2.8天,集群故障恢復速度只需10分鐘,遠低于業界的60分鐘。目前,昇騰AI云服務已經服務超過600家企業客戶,全面適配100個行業主流大模型,以云服務的方式破解了AI算力匱乏與缺乏自主化的難題。
而在AI全棧創新層面,華為云希望通過云系統創新,打造AI Native的云。
華為云CTO張宇昕表示,通過全棧系統性創新,能夠讓大模型的數據準備、訓練、推理、應用實現全流程的高效率和高性能。華為云的全棧系統性創新覆蓋了數據中心、云平臺架構和基礎設施服務,為 AI 開發提供 AI Native 的基礎設施。
一方面,華為云踐行“Cloud for AI”,通過全棧系統性創新,實現大模型的數據準備、訓練、推理、應用的全流程高效率和高性能。華為云的創新覆蓋了數據中心、云平臺架構和基礎設施服務,為AI開發提供AI Native的基礎設施。
另一方面,華為云還希望做到“AI for Cloud”,華為云將盤古大模型和華為在產品研發、數據治理、安全防護、業務運維等各個領域積累的數據和經驗相結合,將華為云的服務重塑、升級,讓華為云更智能、更高效。
圍繞AI Native的云這一目標,在基礎設施方面,華為云打造了下一代云基礎設施CloudMatrix,其能夠改變傳統數據中心的架構和算力供給模式,將傳統的以CPU為中心的主從架構,演進為多元算力對等全互聯架構,并通過高速互聯網絡協議,將CPU、NPU、GPU等算力資源全部互聯和池化,從而把AI算力從單體算力演進到矩陣算力。在存儲方面,華為云首創的EMS彈性內存存儲服務,通過在NPU卡和持久化存儲兩層間增加彈性內存存儲層,基于Memory Pooling專利技術,通過顯存擴展、算力卸載、以存代算等三大手段來打破內存墻,釋放極致算力。
從算力到存儲,從開發工具到大模型本身,華為云已經構筑起了全棧創新,沒有短板的AI基礎設施能力。
面向真行業,解決真問題,實現真落地。這或許是華為云的“逆行”,卻是千行萬業的渴望。
人間是盛景:讓AI走上行業的道
如今,華為云的AI能力服務范疇正在不斷拓展,從AI大模型風潮中收益的行業和企業,正在與日俱增。
在HDC 2024,我們又可以看到一些全新的行業完成了基于華為云AI全棧創新的智能化飛躍。
比如說,在鋼鐵領域大名鼎鼎的寶武鋼鐵,就通過攜手華為云打造鋼鐵大模型,實現了智能化水平的極大提升。
鋼鐵生產流程主要包括高爐、轉爐、連鑄、軋制工藝流程,目前華為云的AI方案在高爐煉鐵和熱軋鋼帶兩個環節中已經得到了有效利用。寶武集團跟華為云合作,用AI大模型實現高爐指標預測,高爐爐況評估,進而實現對高爐工況進行優化,降低高爐能耗,提升高爐產能。雙方團隊合作之下,就大模型在高爐煉鐵的應用梳理出了7大場景,包括焦煤配煤優化、高爐爐溫預測、燃料配比優化等。最終實踐表明,盤古大模型在高爐爐況優化場景預計每年可以為寶鋼降本超過10億元。
高鐵已經是我們每個人生活的一部分。截至2023年底,中國高鐵里程達到4.5萬公里,居世界第一。在高鐵運營工作中,動車巡檢需要人工實施,涉及眾多檢查項,工作量巨大。
一列16編組動車有超過3.2萬個故障檢測項點,覆蓋了8大類型、350多種故障,諸如變形、異物、松動、丟失、斷裂、擦傷、漏油、超限等故障,傳統的故障識別方法需要大量人工工作。
北鐵所與華為云攜手,將華為云盤古鐵路大模型應用于高鐵巡檢機器人,實現了動車檢測的智能化落地,為動車檢測帶來了更多價值,不僅將巡檢工人從繁重的勞動中解放出來,還大幅提升了檢測效率和檢測準確率。
北鐵所聯合華為云采用國內首創的二維圖片+三維點云+激光光譜等多模態融合診斷技術,能精準識別超限、異物等各種復雜故障。多模態融合診斷比起單模態,故障識別準確率可提升到98%以上,為鐵路行業帶來了一種全新的發展思路。
在工業、礦山、媒體、生物制藥等領域,都可以見到華為云的AI能力深入其中,為行業帶來直觀且清晰的價值。
對于大模型來說,紙上談兵只能曇花一現。只有深入行業,深入真正的人間煙火,才能激活獨屬于它的盛景。華為云或許逆行于大模型的“內卷”之風,但行走在千行萬業的智能化正道。
讓雙手做事,讓雙腳沾泥。
讓全棧AI的旗幟獵獵作響。
智能化不是在狹小的空間中零和博弈,而是要用技術去丈量四野八荒。
審核編輯 黃宇
-
AI
+關注
關注
87文章
30728瀏覽量
268886 -
華為云
+關注
關注
3文章
2445瀏覽量
17408 -
昇騰
+關注
關注
1文章
134瀏覽量
6599 -
大模型
+關注
關注
2文章
2423瀏覽量
2640
發布評論請先 登錄
相關推薦
評論