電子發燒友原創 章鷹
7月7日,華為開發者大會在東莞松山湖正式揭開帷幕,華為常務董事、華為云CEO張平安在下午舉行的主題會議上,正式重磅發布盤古大模型3.0。張平安表示:“盤古大模型不會做詩只會做事。它要幫助各行各業,在各個領域讓AI賦予價值,在礦山、金融、政務、氣象,我們有很多的工作小組派下去,為各個行業賦予價值。我們堅持的方向,AIforindustry。”
?
圖:華為常務董事、華為云CEO張平安
2023年,中國的AI團隊開始密集發布各種大模型,從3月開啟到7月就有七款大模型發布,清華智譜AI研發的GLM-1308在3月14日開啟內測; 百度于3月 16 日推出了其最新的生成式人工智能產品和知識增強型大語言模型文心一言;4月10日商湯公布“日日新Sensenova”;阿里4月11日推出大語言模型“通義千問”;科大訊飛在5月6日推出星火認知大模型V1.0版本;時隔一個月,6月9日又推出星火大模型V1.5版;到7月6日,2023世界人工智能大會在上海開幕,中國電信發布大語言模型Telechat。在這屆大會的“邁向通用人工智能”主題展區,集中展示了國內外的30多款大模型。可以說大模型卷起來了。
?
圖:電子發燒友根據公開資料整理
華為云推出的盤古大模型3.0的架構有何精妙之處?在從通用人工智能邁向行業人工智能,走深向實的道路上,華為云的盤古云大模型3.0有哪些接地氣的行業應用?在氣象預報領域,盤古云大模型研發團隊的研發成果為何能登上國際一流期刊《自然》(Nature)雜志?發布會的現場揭示了許多核心疑問。
聚焦行業應用,盤古大模型推出“5+N+X”三層架構
“今年上半年,國內廠商發布了80多個AI大模型,我們注意到這些大模型發布后都具有非常好的對話能力,文案生成能力,很多大模型都會做詩,有的大模型甚至都會作畫。華為盤古大模型不會寫詩,只會做事,盤古大模型需要扎根行業,為各個行業帶來價值。”華為云CEO張平安強調說。
“我們發現當前通用的大模型落地行業應用存在三大挑戰:1、大模型通用性強,但專業性弱,落地行業需要專業知識,了解行業的工作流程,給出專業回答;2、大模型知識多,但是技能不足;3、數據是企業的核心資產之一,大模型可以有效的存儲和挖掘知識,在訓練和使用大模型需要保證企業數據的安全合規。” 華為云人工智能領域首席科學家田奇表示。
為了應對這些挑戰,華為將盤古大模型3.0定位為面向行業的大模型系列,包括“5+N+X”三層架構。
L0層的盤古基礎大模型,包括自然語言、視覺、多模態、預測、科學計算五個基礎大模型,提供滿足行業場景中的多種技能需求。盤古3.0為客戶提供100億參數、380億參數、710億參數和1000億參數的系列化基礎大模型,匹配客戶不同場景、不同時延、不同響應速度的行業多樣化需求。同時提供全新能力集,包括NLP大模型的知識問答、文案生成、代碼生成,以及多模態大模型的圖像生成、圖像理解等能力,這些技能都可以供客戶和伙伴企業直接調用。無論多大參數規模的大模型,盤古提供一致的能力集。
L1層是N個行業大模型,華為云既可以提供使用行業公開數據訓練的行業通用大模型,包括政務,金融,制造,礦山,氣象等大模型;也可以基于行業客戶的自有數據,在盤古大模型的L0和L1層上,為客戶訓練自己的專有大模型。
L2層為客戶提供了更多細化場景的模型,更加專注于政務熱線、網點助手、先導藥物篩選、傳送帶異物檢測、臺風路徑預測等具體行業應用或特定業務場景,為客戶提供“開箱即用”的模型服務。
在煤礦領域,企業用戶通過盤古視覺大模型,識別采掘過程中的大塊的煤和大塊的巖石。山東能源集團及其技術公司云鼎科技,已經和華為深度合作,開發了21個場景化的應用,覆蓋了7大業務系統。盤古礦山大模型已經在全國8個礦井規模使用,一個大模型可以覆蓋煤礦的采、掘、機、運、通、洗選等業務流程下的1000多個細分場景,讓更多的煤礦工人能夠在地面上作業,不僅能讓煤礦工人的工作環境更加舒適,而且可以極大地減少安全事故。
在鐵路領域,盤古鐵路大模型能精準識別現網運行的67種貨車、430多種故障,無故障圖片篩除率高達95%,成為貨運列檢員身邊有力的數字助手,將列檢員從每日數百萬張的“圖海”檢測中解放出來。檢測效率提升20倍。
“原來傳統方式預測10天臺風的路徑,需要在3000臺服務器的高性能計算機集群上花費5小時進行仿真。現在基于預訓練的盤古氣象大模型,通過AI推理的方式,研究者只需單臺服務器上單卡配置,10秒內就可以獲得更精確的預測結果。”張平安表示,“今年5月份,中國氣象局和盤古進行了合作,預測瑪娃臺風路徑,盤古提前10天精確預測瑪娃臺風的路徑,盤古預測的速度和精度已明顯優于傳統的方法。在剛剛結束的第19屆世界氣象大會上,歐洲氣象局也指出,華為云盤古氣象大模型在精度上有不可否認的能力,對2月份芬蘭寒潮的預測,比歐洲的預測方法提前2天,溫度預測更加接近實際發生的溫度。”
盤古氣象大模型的最新成果剛剛登上Nature正刊,只需要1.4秒就能完成24小時全球氣象預報。
扎根AI根技術,實現行業大模型做到四大關鍵點
盤古大模型3.0最底層的基礎大模型包括100億參數、380億參數、710億參數和1000億參數四個版本,預訓練使用了超3萬億tokens。
“要適配行業的不同場景,就必須做完全的解耦。我們將大模型和能力層解耦之后,不管你使用的是380億參數的模型,還是1000億參數的模型,能力級是不變的,是一致的。預測的大模型可以調用能力集,科學大模型也可以調用多模態能力。”張平安指出。
?
華為云人工智能領域首席科學家田奇介紹如何從基礎大模型煉成行業大模型
“盤古大模型基礎層L0層,我們做了上百種能力,包括語言模型的實時問答,文案生成能力,視覺模型的檢測分割,三維重建能力,多模態模型的文生圖能力,以及模型編排和插件等高階能力。盤古大模型的各項能力能夠做到解耦和按需組合,企業客戶可以根據具體的場景需求選擇所需要的數據集,使用盤古大模型工作流,快速開發行業大模型性能力。” 華為云人工智能領域首席科學家田奇表示。
實現行業大模型的四大關鍵點,田奇分析指出:一是沉淀行業知識;二是淬煉行業技能,結合專家和行業數字環境的反饋進行強化學習,以達到符合行業應用的最佳結果;三是對話專業工具,除了人與機器的對話,我們更多解決的是機器與機器,機器與工具的對話,將大模型與業務系統進行融合,產生對話和交流,讓大模型可以調用大量的行業資產和工具;四是保證安全合規,盤古提供公有云、混合云大模型專區,這三種模式保證安全部署。建立長效機制,確保大模型安全合規,包括數據集來源和使用合規,數據全生命周期安全,構建完整的數據標注以及審核機制,構建模型合規使用的政策,確保大模型的使用邊界。
華為在最底層構建了以鯤鵬和昇騰為基礎的AI算力云平臺,以及異構計算架構CANN、全場景AI框架昇思MindSpore,AI開發生產線ModelArts等,為大模型開發和運行提供分布式并行加速,算子和編譯優化、集群級通信優化等關鍵能力。基于華為的AI根技術,大模型訓練效能可以調優到業界主流GPU的1.1倍。
張平安還宣布,單集群2000P Flops算力的昇騰AI云服務在華為云的烏蘭察布和貴安AI算力中心同時上線。昇騰AI云服務除了支持華為全場景AI框架昇思MindSpore外,還支持Pytorch、Tensorflow等主流AI框架。同時,這些框架中90%的算子,都可以通過華為端到端的遷移工具平滑遷移到昇騰平臺。
小結:
行業專家強調AI賦能千行百業,行業大模型非常重要。通用大模型有很強的能力,但并不能解決很多企業的具體問題。企業的大模型應用需要綜合考慮行業專業性、數據安全、持續迭代和綜合成本等因素。基于行業大模型構建自己的專屬模型,也許是企業更優的選項。
盤古大模型3.0已經開始在10多個行業踐行智能化的能力,目前國內在金融、政府、教育、電信、能源領域,多家公司已經發布了行業大模型,競爭日益激烈,具體客戶是否能為華為云、百度云、科大訊飛等公司推出的行業大模型買單,關鍵還要看各家迭代的模型在實際應用當中的應用效果和價值。
-
華為
+關注
關注
216文章
34479瀏覽量
252168 -
大模型
+關注
關注
2文章
2491瀏覽量
2871 -
盤古大模型
+關注
關注
1文章
109瀏覽量
302
發布評論請先 登錄
相關推薦
評論