2023 年 7 日 -9 日,華為開發者大會 2023(Cloud)期間,華為發布盤古大模型 3.0。華為盤古大模型最早在 2021 年發布,發展到今天,盤古大模型已經在金融、制造、醫藥研發、煤礦、鐵路等諸多行業發揮作用。
華為云 CTO 張宇昕在接受 InfoQ 采訪時表示,華為盤古大模型全棧技術均由華為自主創新,從算力到基礎的算子、基礎的框架到盤古的開發平臺以及模型均沒有采用任何開源技術。另外,由于華為云盤古大模型的定位是“AI for Industries”,這些行業大模型里沉淀了客戶的知識經驗,所以華為不會、也不可能把客戶的資產開放出來,也就是說盤古大模型不會開源,而是走商業閉源的道路。
據華為常務董事、華為云 CEO 張平安介紹,盤古大模型 3.0 是面向行業的大模型系列,包括“5+N+X”三層架構:L0 層是 5 個基礎大模型,包括自然語言、視覺、多模態、預測、科學計算,提供滿足行業場景中的多種技能需求。
盤古 3.0 為客戶提供 100 億參數、380 億參數、710 參數和 1000 億參數的系列化基礎大模型,匹配客戶不同場景、不同時延、不同響應速度的行業多樣化需求。同時提供全新能力集,包括 NLP 大模型的知識問答、文案生成、代碼生成,以及多模態大模型的圖像生成、圖像理解等能力,這些技能都可以供客戶和伙伴企業直接調用。無論多大參數規模的大模型,盤古提供一致的能力集。
L1 層是 N 個行業大模型,華為云既可以提供使用行業公開數據訓練的行業通用大模型,包括政務,金融,制造,礦山,氣象等大模型;也可以基于行業客戶的自有數據,在盤古大模型的 L0 和 L1 層上,為客戶訓練自己的專有大模型。
L2 層是為客戶提供 X 個細化場景的模型,更加專注于政務熱線、網點助手、先導藥物篩選、傳送帶異物檢測、臺風路徑預測等具體行業應用或特定業務場景,為客戶提供“開箱即用”的模型服務。
盤古大模型采用完全的分層解耦設計,一方面是為了快速適配、快速滿足行業的多變需求,背后更是華為希望借此構筑出良好的商業模式的考慮。
在解耦的三層設計之上,客戶既可以為自己的大模型加載獨立的數據集,也可以單獨升級基礎模型,可以單獨升級能力集。在 L0 和 L1 大模型的基礎上,華為云還為客戶提供了大模型行業開發套件,通過對客戶自有數據的二次訓練,客戶就可以擁有自己的專屬行業大模型。同時,根據客戶不同的數據安全與合規訴求,盤古大模型還提供了公用云、大模型云專區、混合云多樣化的部署形態。
張平安強調,盤古大模型的路標圖價值將更注重于行業應用的深化和擴展。團隊已經在鐵路、煤礦、金融和政府等行業開展了大模型的應用,并且還有許多行業需要大模型的支持。未來,團隊將加快行業大模型的開發速度,并且在行業垂直領域深化應用。
算力是訓練大模型的基礎。本次大會上,張平安還宣布單集群 2000P Flops 算力的昇騰 AI 云服務在華為云的烏蘭察布和貴安 AI 算力中心同時上線。昇騰 AI 云服務除了支持華為全場景 AI 框架昇思 MindSpore 外,還支持 Pytorch、Tensorflow 等主流 AI 框架。
毫無疑問,大模型的投入是巨大的。不過張平安亦坦言,現階段討論盤古大模型的成本與收益還為時尚早,華為在貴陽和烏蘭察布投入了大量昇騰 AI 算力,并相信把昇騰 AI 算力做好之后,中國的許多行業以及重塑將會采用盤古大模型。
-
華為
+關注
關注
216文章
34417瀏覽量
251524 -
數據集
+關注
關注
4文章
1208瀏覽量
24690 -
大模型
+關注
關注
2文章
2427瀏覽量
2647 -
盤古大模型
+關注
關注
1文章
109瀏覽量
251
原文標題:華為盤古大模型 3.0 發布:不開源,現階段談投入和收益為時尚早
文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論