超算和AI一直是兩個并駕齊驅的賽道。一直以來超算重視硬件算力,一般用于國防、模擬、生物、天文科學研究等領域,比如我國的天河、神威,美國阿貢國家實驗室和勞倫斯·利弗莫爾國家實驗的米拉和泰坦。
而AI領域,在早期階段各團隊強調在算法和調參上不斷優化,而且當時的計算機架構并不適合做卷積神經網絡的訓練,在CPU上訓練出一個模型可能達數年之久。
直到從深度學習的開山鼻祖Geoff Hinton的學生Alex Krizhevsky在GPU上成功訓練出突破性的深度神經網絡之后,專用于AI硬件的概念才被各界所看重。
對于AI來說,算力與硬件架構同等重要,也就是在這種理念指導下,超算能力在AI的應用開始顯得分外重要。
不論從目前國際產業競爭形勢亦或是產業自身革新,AI超算背后的硬件和框架如何發展,將會是國內AI下一輪爆發關鍵基礎。在國內AI賽道,華為作為全球頂尖的ICT基礎設施和智能終端供應商,已經攜“昇騰”處理器給出了完整的AI超算解決方案。
這對于國內AI的研發和應用效率的提升,毫無疑問是一場及時雨。
近日華為出席ISC(高性能計算大會)后,全球AI賽道產業鏈上下游給予了高度關注。
關鍵領域沒有歲月靜好,超算融合AI已風起云涌
國運之爭的核心是產業實力的綜合競爭,而AI已經成為國運之爭中的一環。
國內三十年歲月靜好的改革開放紅利已經到了戰略博弈的臨界點,像AI這種尖端產業正在成為大國博弈的橋頭堡。
硬件是AI算法迭代的基礎,沒有技術之上的硬件自主權,就如同只有施工圖紙而沒有鋼筋水泥,難以擺脫被控制的窒息感。
2018年美國公布了超算“Summit”,這臺超級計算機是由IBM在英偉達幫助下開發,它的峰值計算能力可以達到每秒20億億次。
更重要的,Summit是史上第一臺既支持傳統計算,也支持運行人工智能應用程序的超級計算機,機器學習和神經網絡等運行都可以在其上實現。
今年6月23日,全球超級計算機500強榜單更新,中國以226臺部署量位列第一,美國一114臺名列第二,日本以30臺位居第三。但是在TOP500的榜單系統,有333套采用了英偉達的技術。
我國的AI超算解決方案直到華為的達芬奇架構公布后才有系統的解決方案,中國在AI超算領域的研發和應用,還需要點一把火,加一把勁。
框架和硬件“兩開花”,研發標準統一才是“戰斗力”
華為在2018年7月創新推出針對AI計算的達芬奇架構,在項目下公布了“昇騰”AI處理器+AI開源計算框架“MindSpore”。
由于華為給出了從硬件到框架一整套的解決方案,特別契合當下AI超算硬件成為新基建的公共特性。
這將會對AI業態造成三個方面的顯著正面影響:AI全行業滲透、提升開發效率以及降低算力成本。
1.全棧高算力平臺,帶動AI全行業滲透
在以往的AI開發中,架構、API、生態和運維都需要專門人才進行支持和管理,開發環境復雜,人才數量少,全球的AI人才供需比只有1%,只有三萬核心專家。從行業上看,中國市場含有AI的應用僅有10%,全行業AI滲透率只有4%。
國內AI的研究很火熱,2019年斯坦福人工智能索引報告顯示中國的人工智能論文數量超過歐盟,但是行業應用有限。
要實現全面超越,形成產業聚集優勢,亟需AI超算的基礎設施,帶動全行業的AI應用和轉型。
華為的AI超算解決方案從硬件標準、運算集群和運維管理上都為應用者提供了統一方案。
在硬件標準上,“昇騰”的Da Vinci架構架構中含有Cube、Vector、Scalar三種計算單元,平均算力是業界算力的兩倍。
基于“昇騰”處理器的Atlas集群在全球最快AI訓練集群的基礎上,部署了普惠性的AI開發平臺ModelArts和CANN開發工具。
尤其是ModelArts,作為一個“一站式”的開發平臺,讓AI開發的各個環節,包括數據處理、算法開發、模型訓練、模型部署都可以在ModelArts上完成。
這極大地降低了AI開發的門檻。這樣一個專供AI的基礎性商業超算系統已經成型。
基于這個系統,使用者可以極大減少資源調度成本,降低開發成本,最主要的是降低算力成本。
由于AI正在成為通用目的技術,使用場景會越來越廣,同時也意味著后入場的行業引入AI的門票費會越來越高,華為的超算架構讓更多場景與AI融合降低了門檻,促進了AI向全行業滲透。
2.自主框架MindSpore,開發態和運行態雙重提速
由于華為配合“昇騰”處理器的自主計算框架MindSpore的全場景特性,“開發態”和“運行態”都有優勢。
所謂“開發態”是指計算框架非常友好,顯著減少模型訓練時間和成本。而且能夠適應不同的場景,包括端、邊緣和云。
“運行態”友好是指能夠讓整個模型能夠用最少的資源產出最高的效能。
MindSpore天然匹配昇騰全場景系列產品,能夠讓不同類型的算法都可以輕松接入,這無疑降低了研發人員的調試和讓代碼適應場景的成本。
而且這個計算框架能夠實現自動并行,這對與模型的效率則有很大影響,開發者無需投入過多的時間再去修改并行代碼,能夠更好的專注于模型質量。
以上兩點就是計算框架的開發態以及運營態的優勢。
更重要的是因為框架針對華為“昇騰”處理器有專門的優化,所以在應用效率上可以更高。
AI+超算處于爆發前夜,行業拐點也如約而至
超算和AI領域的融合,國內很多企業在做相關探索,但大多是有心無力。
為什么是華為率先引領?筆者認為有以下三個因素:
1、 華為擁有技術實力。華為2019研發投入達到1317億元,研發占比15.3%,擁有85000+專利授權。
2、 華為擁有用戶接受度。華為客戶國家覆蓋170以上,國家級備件中心122家以上,服務伙伴3900個以上。
3、 華為擁有行業高度。華為已經成為民族企業代表,在AI超算領域構建基礎框架,不僅有商業價值,也與國內新基建下的AI戰略相一致。
華為憑借自身在硬件領域的多年積累和行業前瞻,以創新的達芬奇架構為開端,為國內AI+超算這個關鍵領域填補了空白。
總而言之,昇騰是SOC、計算平臺和產業生態,目前國內基于華為“昇騰”處理器已經有鵬城實驗室、上海天文臺等多個成功項目。從項目內容上看,既有國家重大項目,又有在天文學這類的尖端學科應用。
本次全球超算大會結束后,“昇騰”受到了各界廣泛的關注,在新基建的的熱潮中,將為全行業的AI化提供算力加持。
更重要的是,我們很有可能看到國內各界全面擁抱AI超算,同時擁抱華為昇騰AI的局面。
這將成為國內AI轉型的關鍵節點。
-
華為
+關注
關注
216文章
34417瀏覽量
251535 -
AI
+關注
關注
87文章
30763瀏覽量
268909 -
超算
+關注
關注
1文章
115瀏覽量
9070
發布評論請先 登錄
相關推薦
評論