大模型開始“卷”起來了。
去年年底,ChatGPT往喧囂已久卻未有波瀾的AI“湖面”投擲了一枚“石頭”,僅用2個月時間就收獲了1億用戶。
當學生用其寫論文、程序員讓其輔助生成代碼,甚至作為小編的我都借助ChatGPT起標題時,AI大模型如綿綿細雨無聲地融入了我們的日常生活。
一石激起千層浪
“一石激起千層浪?!焙鋈婚g,國內的大模型如雨后春筍般興旺起來。當3月份辦公室還在“馬冬梅”般討論著百度的大模型究竟是“文言一心”還是“文心一言”時,4月份阿里巴巴的“通義千問”,5月份科大訊飛的“星火認知”、中國科學院的“紫東太初2.0”又席卷而來。
近日,在中國聯通官宣了“鴻湖”大模型后,中國電信也聲稱將要發布“TeleChat”大模型,中國移動的“九天”1+N大模型也在“蠢蠢欲動”。連運營商都開始進軍大模型了,難道說大模型賽道真的成為互聯網領域的“兵家必爭之地”了嗎?
今日,華為也開始發布了盤古大模型3.0。盡管業界大模型層出不窮,但從注冊“盤古”“PANGU”商標專利,到爆料又辟謠盤古大模型稱“盤谷Chat”,華為大模型的一舉一動仍是受到了業界的關注。
其實,華為從2020年就開始立項大模型研究,在2021年4月也就是前兩年的HDC大會上,華為就發布了盤古NLP大模型1.0和盤古視覺大模型。當時,時任華為云CEO的余承東還給予了“華為云盤古大模型是一款在AI產業界非常、非常、非常震撼的產品”重要事情說三遍的稱贊。
2021年的盤古NLP大模型,不僅是業內首個千億參數的中文大模型,而且在預訓練階段學習了超過40TB行業文本數據和400萬小時的行業語音數據,具有1100億參數。在大模型中,參數占有重要的分量。所謂的AI大模型就是將海量數據導入具有億量級參數的模型中,機器通過完成類似“完形填空”的任務后,最終被訓練成具有邏輯推理和分析能力的人工智能。目前大模型參數均在千萬億級別,GPT-3擁有1750億參數(即175B)。而后,在2021年5月,最大版本參數量達2000億的“鵬程·盤古”大模型也重磅亮相,2021年的盤古大模型著實稱得上“厚積薄發”。
同時,2021年的盤古視覺(CV)大模型也是一個超30億參數的CV大模型。在預訓練時就輸入了10億級圖像,能夠同時滿足底層圖像處理與高層語義的理解需求。
此后,華為又相繼推出了盤古科學計算大模型、用于藥物研發細分場景的大模型、盤古礦山大模型、盤古氣象大模型、盤古海浪大模型、盤古金融OCR大模型等。
就在華為正式發布盤古大模型3.0的前一天,又一個重磅的新聞刷屏——華為云盤古氣象大模型研究成果在《Nature》正刊發表。據了解,此模型是首個精度超過傳統數值預報方法的AI模型,速度相比傳統數值預報提速10000倍以上。這篇論文是近年來中國科技公司作為署名單位發表的《自然》正刊論文,《Nature》審稿人也對該成果給予高度評價。這一喜報又為盤古大模型3.0的發布平添了一份期待。
千呼萬喚始出來
“千呼萬喚始出來”。今日,華為常務董事、華為云CEO張平安正式發布了華為盤古大模型3.0。面對大模型“神仙打架”的現狀,他談道:“自OpenAI發布ChatGPT以來,各種大模型層出不窮,百家齊放。據不完全統計,全球已發布數百個大模型,僅在中國就發布了80多個。有些大模型會寫詩、會作畫。但華為盤古大模型不會作詩、只會做事,因為它要深入到各行各業中去,賦能各行各業創造價值?!?/p>
華為對應基礎大模型、行業大模型和細分場景大模型分為L0、L1和L2層。據張平安介紹,盤古大模型3.0是一個面向行業的大模型系列,包括“5+N+X”三層架構,其中,“5”指的是L0層的自然語言、視覺、多模態、預測、科學計算這5個基礎大模型;“N”是指L1層的N個行業大模型,華為云既可以提供使用行業公開數據訓練的行業通用大模型,包括政務,金融,制造,礦山,氣象等大模型。也可以基于行業客戶的自有數據,在盤古大模型的L0和L1層上,為客戶訓練自己的專有大模型;“X”則表示L2層為客戶提供了更多細化場景的模型,提供無限“X”的可能性,L2更加專注于政務熱線、網點助手、先導藥物篩選、傳送帶異物檢測、臺風路徑預測等具體行業應用或特定業務場景,為客戶提供“開箱即用”的模型服務。
值得一提的是,盤古大模型采用完全的分層解耦設計,可以快速適配、快速滿足行業的多變需求。客戶既可以為自己的大模型加載獨立的數據集,也可以單獨升級基礎模型,也可以單獨升級能力集。在L0和L1大模型的基礎上,華為云還為客戶提供了大模型行業開發套件,通過對客戶自有數據的二次訓練,客戶就可以擁有自己的專屬行業大模型。同時,根據客戶不同的數據安全與合規訴求,盤古大模型還提供了公用云、大模型云專區、混合云多樣化的部署形態。
目前,盤古大模型已在金融、金融、制造、醫藥研發、煤礦、鐵路等諸多行業發揮著巨大價值。在政務領域,華為云攜手深圳市福田區政務服務數據管理局,上線了基于盤古政務大模型的福田政務智慧助手小福,能夠精準理解民眾咨詢意圖,改變傳統的一網通辦模式,把老百姓的話語轉化為政府辦事的語言,讓城市更有愛;在煤礦領域,盤古礦山大模型已經在全國8個礦井規模使用,一個大模型可以覆蓋煤礦的采、掘、機、運、通、洗選等業務流程下的1000多個細分場景,讓更多的煤礦工人能夠在地面上作業,不僅能讓煤礦工人的工作環境更加舒適,而且可以極大地減少安全事故;在藥物研發領域,原來一款新藥研發平均需要10年時間、花費10億美金。盤古藥物分子大模型助力西安交通大學第一附屬醫院劉冰教授團隊發現全球40年來首個新靶點、新類別的抗生素,并將先導藥物研發周期縮短至1個月、研發成本降低70%……
“盤古為行業而生,就要為行業著想,更好地服務千行百業的客戶?!睆埰桨脖硎荆P古大模型要讓每個行業、每個企業、每個人都擁有自己的專家助手,讓工作更高效更輕松。我們始終堅持AI for Industries的戰略,在深耕行業的道路上不斷前行。我堅信大模型將重塑千行百業,而每一個開發者,都將是改變世界的英雄。
結語
中國的古代傳說中,盤古通過“開天辟地”讓混沌的宇宙煥發生機。希望,華為的盤古大模型也能在人工智能的潮流中帶給行業更智能化、更光明的未來,創造“新宇宙”!
-
華為
+關注
關注
216文章
34411瀏覽量
251513 -
nlp
+關注
關注
1文章
488瀏覽量
22033 -
大模型
+關注
關注
2文章
2424瀏覽量
2645 -
盤古大模型
+關注
關注
1文章
109瀏覽量
251
原文標題:“神仙打架,盤古來啦!”華為盤古大模型3.0正式發布
文章出處:【微信號:txshj123,微信公眾號:通信世界】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論