9月12日,由工業和信息化新聞宣傳中心承辦的“算力服務高質量發展論壇”在2024中國國際服務貿易交易會期間召開,九章云極DataCanvas公司AI首席科學家繆旭受邀出席論壇,并發表“大模型后訓練時代的算力服務思考”主旨演講。
本次論壇以“以算凝力,融創未來”為主題,匯聚來自政、產、學、研界多位重量嘉賓,剖析算力產業最發展新趨勢,分享算力基礎設施建設實踐經驗,共同探討算力服務高質量發展之道。
論壇上,繆旭先生在演講中表示,隨著基礎模型面臨的挑戰不斷升級與復雜化,大模型后訓練模式正在崛起,成為應對上述挑戰的關鍵路徑。然而后訓練模式的復雜性與高度定制化需求,對算力資源的精準調度、靈活配置和高效利用提出了前所未有的高標準挑戰,企業亟需高質量、高效能、更經濟、更好用的算力服務新范式。
九章云極DataCanvas公司AI首席科學家繆旭發表演講
更自動、更高效、更精準,大模型后訓練模式崛起
繆旭指出,當前基礎模型發展迅猛,擁有廣泛的行業應用潛力,但也面臨著提示詞工程復雜度高、難以規避的幻覺問題、規劃能力不足以及高昂的成本負擔等核心挑戰。繆旭表示,通過大模型后訓練策略的補足,可以有效應對上述瓶頸。
大模型后訓練的核心策略為,在大模型基礎訓練完成后,通過使用新的數據集或任務對模型進行再次訓練,以提高模型的適應性和性能。這個過程通常包含提示詞設計、模型微調、embedding優化及調度優化等多個環節。
具體而言,大模型后訓練的過程如下:將復雜的業務邏輯梳理并封裝成獨立的、可管理的任務模塊;隨后針對每個單一任務模塊實施精準的后訓練微調,以增強其針對特定任務的適應性和性能。在完成模塊集成重組后,結合業務系統及用戶的互動反饋,持續進行自我學習和自我增強,最終實現模型性能自動、高效的持續提升。
大模型后訓練方法的補足
新標準、新需求、新模式,普惠算力開啟AI新時代
在大模型后訓練的過程中,算力調度尤為關鍵,包括訓練期的數據準備調度、微調任務編排,以及推理階段的動態加載和異構算力管理。通過在調度過程中引入可訓練的調度模型,在優化目標時增加效率和成本計算,結合線上、線下收集的數據持續優化調度模型,可以從軟件層面有效提升算力調度能力,并降低計算成本,使算力應用更加貼近實際應用場景。
不同任務工作流的安排調度
在數據存儲與處理的關鍵環節,大模型后訓練模式對系統的安全性提出了更高要求,以確保算力資源能夠無縫且安全地融入各類業務系統。依托業務系統與互聯網的海量數據資源,以任務為驅動,大模型可以智能識別任務需求,自動收集并處理所需數據,生成高質量的微調數據集。此外,應用存算一體架以構可以有效降低數據傳輸的帶寬消耗,提升數據處理的整體效率與安全性。
面對不同行業、不同場景的多樣化大模型后訓練需求,基于Alaya NeW高效的算力管理內核,九章云極DataCanvas公司提出國際首創的算力服務新范式,憑借統一性能基準、資源管理優化、方便估算成本收益、算力一體化等優勢,提出了統一的算力服務計量單位“度”(DCU),并用其實現標準化的算力計量計費,讓算力消費者輕松獲得好用、經濟、普惠的算力服務,實現算力資源0浪費。此外,通過提供完整的大模型+Agent開發工具鏈,Alaya NeW為各行業用戶提供靈活的大模型和AI Agent定制能力,加速人工智能技術在各領域的深度融合與廣泛應用。
作為國內領先的人工智能基礎設施提供商,九章云極DataCanvas公司將繼續堅持AI技術的自主創新,以領先的AI智算產品推動算力服務向更高質量、更高水平邁進,深度賦能千行百業的數智化轉型。
-
AI
+關注
關注
87文章
31097瀏覽量
269430 -
算力
+關注
關注
1文章
992瀏覽量
14861 -
大模型
+關注
關注
2文章
2482瀏覽量
2849
發布評論請先 登錄
相關推薦
評論