今日下午,華為公司的開發者大會(Cloud)如期而至,但與往年不同的是,今年大會在深圳大學城設立主會場,此外,華為公司聯合鯤鵬生態創新中心、華為云產業云創新中心和智能基座高校同步在全國36座城市,開設超過70個分會場。分享ICT技術在行業內的深度創新和最佳實踐等話題,覆蓋機器學習、深度學習、鯤鵬、昇騰、量子計算等熱門領域。
會上,華為公司的消費總裁余承東發布了6大創新產品及服務,包括華為云CCE Turbo云容器集群、CloudIDE智能編程助手、GaussDB(for openGauss)數據庫、可信智能計算服務TICS、華為云盤古系列大模型(包含全球最大規模的中文NLP大模型及CV大模型等)、多樣性計算基礎軟件。
同時,華為公司宣布2021年將向“沃土計劃2.0”投入2.2億美元,包括發布“沃土云創”計劃、以及鯤鵬眾智計劃和昇騰眾智計劃等。
華為云盤古大模型:世界第一、千億參數,逼近人類神經元
其名盤古,開天辟地。
據介紹,盤古大模型橫攬AI領域四大熱門方向:
自然語言處理(NLP)大模型
計算機視覺(CV)大模型
多模態大模型
科學計算大模型
華為云盤古大模型包括4大系列:
華為云盤古NLP大模型:是業界首個千億參數中文語言預訓練模型,預訓練階段學習了40TB中文文本數據,是最接近人類中文理解能力的AI大模型。
華為云盤古CV大模型:是目前業界最大的視覺預訓練模型,包含超過30億參數。
未來將持續推出多模態和科學計算大模型。
具體而言,盤古NLP大模型在權威的中文語言理解評測基準CLUE榜單中,總成績及分類、閱讀理解單項均排名第一,刷新三項榜單世界歷史紀錄,總成績得分83.046。
而盤古CV大模型,則在ImageNet 1%、10%數據集上的小樣本分類精度上,達到了業界最高水平。
盤古NLP大模型的三大突破
盤古NLP大模型是全球最大的千億參數中文語言預訓練模型,由華為云、循環智能和鵬城實驗室聯合開發,預訓練階段學習了40TB中文文本數據,并通過行業數據的樣本調優提升模型在場景中的應用性能。
盤古NLP大模型在三個方面實現了突破性進展:
第一,具備領先的語言理解和模型生成能力:在權威的中文語言理解評測基準CLUE榜單中,盤古NLP大模型在總排行榜及分類、閱讀理解單項均排名第一,刷新三項榜單世界歷史紀錄;總排行榜得分83.046,多項子任務得分業界領先, 向人類水平(85.61)邁進了一大步。
盤古NLP大模型位列CLUE榜單總排行榜第一
在NLPCC2018文本摘要任務中,盤古NLP大模型取得了Rouge平均分0.53的業界最佳成績,超越第二名百分之六十。
30億參數,全球最大視覺預訓練模型
盤古CV大模型致力于解決AI工程難以泛化和復制的問題,開創AI開發工業化新模式,大大節約研發成本。此外,盤古CV大模型提供模型預訓練、微調、部署和迭代的功能,形成了AI開發完整閉環,極大提升AI開發效率。目前,盤古CV大模型已經在醫學影像、金融、工業質檢等100余項實際任務中得到了驗證,不僅大幅提升了業務測試精度,還能平均節約90%以上的研發成本。
華為云盤古大模型,是如何煉成的?
左手CANN算子,右手MindSpore框架,主要依托的便是這兩大“基本功”。
CANN是華為推出的異構計算架構,2018年推出1.0版本至今,已經迭代到了3.0版本。
目前不僅使用于推理、訓練場景,還能夠實現“端邊云協同”。這就意味著不必在不同的終端,再去開發不同的算子,大大提高了效率。
舉個實戰例子,用盤古訓練超大模型靜態圖,性能直接提升了40%之多!
同時,華為宣布2021年將向“沃土計劃2.0”投入2.2億美元,包括發布“沃土云創”計劃、以及鯤鵬眾智計劃和昇騰眾智計劃等。
華為Cloud BU總裁、華為消費者云服務總裁張平安表示,華為云沃土云創計劃將投入1億美元,重點賦能SaaS和ISV伙伴,提供云資源、技術賦能和商業推廣支持,覆蓋容器/微服務、SaaS化、大數據、AI、視頻、智能邊緣等6大技術領域。
華為云最早在2015年提出了“沃土計劃”,并在2019年發布了“沃土計劃2.0”,華為堅持“硬件開放、軟件開源、使能伙伴、發展人才”,推動產業繁榮發展。
截至目前,圍繞華為云、鯤鵬、昇騰累計發展了240萬名開發人員。
數據顯示,華為云所保持的增速高達168%,而且已經連續四個季度位居中國公有云服務市場第二。4月21日,在國際知名研究機構Gartner的報告中指出:2020年,華為云全球IaaS市場排名上升至中國前二、全球前五,主流廠商增速最快,成為全球五朵云之一。
伙伴基于鯤鵬主板的產品發貨量達到2020年總量的52%。
圍繞操作系統、數據庫、AI框架等技術,建設了openEuler、openGauss和MindSpore三大開源社區,如今已初具規模。
2020年,華為在沃土計劃2.0計劃上,總投入已經達到了2億美元 (約13億人民幣)的規模。
另外,華為與中國教育部合作,共同建設“智能基座”產教融合協同育人基地,如今已經與72所高校開展合作,累計開設1000多門課程,培養了1500多名教師,計劃5年培養300萬高校開發者。
畢竟,華為云認為“每一個開發者都了不起”:
在數字時代,開發者就是時代的弄潮兒,是改變世界的力量,更是企業創新的動力和產業的靈魂。
華為發布大會上發布的六項技術主要包括以下這些:
1.云基礎設施——華為云CCE Turbo
以容器為核心的云原生基礎設施,不僅讓資源利用率更高,還能解放運維人員,聚焦應用和業務創新。但是,容器的規模化應用,也對性能、彈性、調度能力提出了更高要求。
2.應用使能——華為云CloudIDE
基于智能代碼補全技術,華為云CloudIDE可以找到所有的補全結果,大幅提升代碼的準確性;其次,支持復雜上下文進行補全;第三,避免推薦過期、棄用、危險的API。華為云CloudIDE,讓代碼更健壯、更安全。
3.數據使能——華為云GaussDB(for openGauss)
企業上云,實現數據驅動,核心是數據庫上云。為了幫助企業開發者更好的應對幾何級增長的數據規模和數據流量洪峰,讓業務“始終在線”無中斷,今天,我們正式發布企業核心數據上云的信賴之選——華為云GaussDB(foropenGauss)數據庫。
4. 數據使能——TICS可信智能計算服務
數據作為關鍵生產要素,一定要流動才能發揮更大的價值。釋放數據價值的關鍵是可信安全流通,但開放難、共享難、流通難是亟需解決的三大挑戰。
基于多方數據聯邦探查和建模,讓隱私數據不出域,可用不可見。
通過聯邦AI算法和同態加密算法協同,實現模型批量計算,訓練性能提升10倍,無須加速卡,也能大幅提升計算性能。
支持主流大數據源,無須轉換即可適配。
5. AI使能——華為云盤古大模型
華為云盤古大模型包括4大系列:業界首個千億級生成與理解中文NLP大模型、業界最大的CV大模型,未來我們將持續推出多模態和科學計算大模型。
華為云盤古NLP大模型在中文語言理解測評中,在總榜、分類榜、閱讀理解榜獲得三項第一,大幅刷新業界紀錄。總排行榜領先第二名1分,這是什么概念?就如同百米賽跑的世界紀錄,每次0.01秒的突破,都是在超越極限。
6.計算基礎軟件持續創新,使能多樣性算力
根深方能葉茂,云的創新離不開操作系統、數據庫、中間件等基礎軟件根技術的支撐。如果說處理器是計算產業的“心”,基礎軟件就是計算產業的“魂”。
創新無止境,讓黑土地更肥沃
與開發者一樣,創新一直是華為的DNA,華為公司的成長史就是一部創新史。開放華為三十多年積累的創新能力,華為云持續投入,不斷進步,為開發者提供更加肥沃的黑土地。
今天,華為公司正式發布了6大創新技術,希望能夠幫助開發者抓住智能升級的黃金機會,站在華為的肩膀上創造未來。
最強的智,是眾智;最大的力,是合力。每一個開發者,都在創造一往無前的奔騰時代。世界有你,了不起!
本文綜合整理自藍血研究 心聲社區 EDN綜合報道
責任編輯:pj
-
數據
+關注
關注
8文章
7004瀏覽量
88944 -
華為
+關注
關注
216文章
34411瀏覽量
251515 -
AI
+關注
關注
87文章
30747瀏覽量
268900 -
數字化
+關注
關注
8文章
8710瀏覽量
61730
發布評論請先 登錄
相關推薦
評論