對于喜歡看武俠片的讀者來說,武俠的魅力就在于通過藝術的加持,將那些夸張的、非常規的武學招式,用符號化的審美來進行消解,使其在具備感官刺激的同時,不會讓人產生不舒適感。比如成龍電影中的一招一式輕盈敏捷,如同舞蹈一樣充滿節奏感;徐克則會通過科技和想象來演繹武俠中的超凡神功。
既能一力降十會,也要一巧破千斤,用來形容社會對智能計算的渴盼,也并不為過。眾所周知,算力已經成為數字經濟時代重要的增長引擎,算力跟不上,意味著各種高性能的算法無法規模化部署,眾多產業智能化轉型會面臨停滯。但解決方法顯然不是一味地按照傳統超腦和數據中心的思路來堆疊硬件,而是根據AI計算的特性來有的放矢地更新基礎設施。
在喜歡強調“有多少算力就有多少智能”的計算領域里,真的能產生這種反差萌嗎?以“智能時代·算力賦能”為主題的第二屆中國超級算力大會ChinaSC,就有來自國內外產學研各界的大咖學者們,嘗試帶我們尋找未來的答案。
AI奇襲高性能計算,對壘需要連招
拆招之前,首先需要搞清楚的是,AI之于計算到底意味著何種變數。如今,在小學生的科普讀物中開篇都會提到:算法、算力、數據,構成了AI的三要素。而現實應用中,算力面臨的挑戰卻很復雜。新基建、數智化、IoT等等這些技術趨勢落地,所表現出的就是數據量的規模無限擴大,數據更新頻次趨近實時,這些都意味著,需要被高效處理的數據越來越多了。OpenAI的行業報告顯示,AI算力需求每3.5個月就會翻一番。去哪里尋找更多算力,廠商們給了不少答案,比如云計算、高性能計算等等。
但AI算力并不是一個將其他產業構建拿來東拼西湊,就可以完成的工作,它需要將計算與AI進行體系化的思考。舉個例子,AI發展也讓計算資源稀缺的情況愈加凸顯,如今,業內開始使用具備頂級計算能力的超算系統來為AI提供助力,這也對高性能計算提出了新的挑戰:
一是性能,越來越多的企業利用HPC來滿足海量數據和卷積神經網絡的訓練需求,但受限于摩爾定律逐漸趨近天花板,以及半導體工藝對芯片功耗的影響,從2013年開始,全球超級計算機的性能提升速度開始變得平緩,很難繼續保持十年一千倍的發展速度。新基建龐大的數智化轉型需求,該如何保證算力供給,已經變得緊迫;
二是融合, AI面對的是許多種類的計算任務和計算架構,高性能計算也要解決傳統超算為數值計算設計的瓶頸,可以讓多種芯片協同工作、實現分布式訓練。而目前按照業內的共識,很多高性能計算都不是為人工智能設計的,導致AI所需要的能力沒有提升上去,是需要迫切解決的。
三是功耗。經典高性能計算的性能功耗和性價比都比較低,事實上,登納德縮放比例定律(Dennard Scaling)從2007年開始放緩,到2012年幾乎變為零,也就是說,單個晶體管的功耗并不能伴隨著密度的增加而下降,依靠擴大并行規模來提高性能、打造“算力恐龍”的方法效率低下,需要花費更多的時間和能耗。要應對數智化浪潮,就必須尋找更合理的架構。
多樣性的算力,對計算基礎設施提出了全新的要求。如果用武俠電影來形容的話,智能計算靠的不是一招一式的武打功夫,而是綜合了科技手段、電影表現、拍攝特技等等共同營造出的整體效果。既要抗打,又要靈巧,各路招式融會貫通,顯然需要一次底層硬件和軟件的整體進化。想要回答這個時代命題,產業領軍者的戰略選擇與具體動作就十分值得關注了。
比武臺上的江湖:領軍者華為如何應對算力大考?早在2017年,中國工程院院士李國杰就曾提到,人工智能可能是中國在超算上彎道超車的一條途徑。在本屆超級算力大會上,中國工程院院士鄭緯民也進一步強調,高性能AI算力基礎設施對促進經濟發展、產業升級和科技進步具有重要意義。
而華為作為ICT產業的“頭雁”企業,在過去數年間正是按照這一發展方向布局數據基礎設施。也憑借其在“大國算力”領域所做出的成績,獲得“大數據和智能計算領軍企業”這一榮譽。這樣的重磅獎項,顯然不是無的放矢。根據評選標準我們發現,這個獎項是授予那些在計算領域開展架構創新,在通用計算與人工智能計算產業的發展中做出巨大貢獻的企業。那么,華為在計算領域的先進性到底體現在哪些方面,或許能夠幫我們解決當下關鍵歷史時期關于智能計算的種種困惑。
目前看來,華為針對前面提到的三個關鍵算力問題,做了以下工作:
1.底層研發“基本功”,軟硬件協同突破算力性能瓶頸。
正如前面所說,單純地升級制造工藝或堆疊芯片硬件,并不足以打破高性能計算的性能增長放緩問題。華為所提供的解決方案,則從計算架構、處理器、基礎軟件,以及華為云服務等一整個計算鏈條,通過長周期的研發投入,進而共同完成高性能計算集群的性能突圍。
比如華為基于新一代2U雙插槽機架式服務器,其功耗比競爭對手低20%。軟件層面,華為獨創IO智能預取和SPARK機器學習算法及圖增強算法,使能鯤鵬在大數據場景獲得倍級性能提升。推出的開源數據虛擬化引擎openLooKeng,則支持跨數據格式、跨數據源、跨數據中心的海量分析,華為合作伙伴北明軟件所打造的北明數據資產管理平臺V4.0,就基于openLooKeng大幅度提升了性能。
以江蘇電信為例,去年7月成功上線了全球首個基于鯤鵬處理器的運營商大數據平臺。經過雙方攜手完成基于鯤鵬處理器的開源Hadoop源代碼編譯,讓關鍵的大數據業務組件在華為TaiShan服務器上的成功部署,實現了兩種不同架構的服務器有效兼容。軟硬件的底層深度開發,是華為能夠在智能計算領域厚積薄發的根本保障。
2.AI與HPC融會貫通,打造全面智能的計算系統。
武俠迷可能都知道,混練兩種屬性不同的上乘武功,可不是一加一等于二那么簡單,很容易走火入魔。融合的過程就如同“增熵”,在增加新事物的過程中也會讓原本無傷大雅的小問題持續疊加,不及時糾正最終會導致整個系統走向混亂、失序。而人工智能算力系統更是具備高度異構、復雜多樣、動態性強等等難題,極大地增加了系統的潛在不穩定性。如何將人工智能AI與高性能計算HPC融會貫通,提供彈性、泛在的算力服務,對于ICT廠商來說并非易事。
華為的多樣性計算解決方案,則覆蓋了云、邊、端的全棧AI,一方面,建構了全面的AI產品創新矩陣,包含著昇騰系列AI芯片、全場景AI計算框架MindSpore、Atlas全系列產品和基于昇騰云服務等組成部分。無論是加速卡、加速模塊、服務器等終端計算硬件,還是智能小站這樣可以在邊緣部署的產品,豐富的智能計算產品讓不同場景各取所需。
同時,算力系統與人工智能協同發揮各自優勢,實現統一的散熱設計、交換網絡和運維管理。這種整體層面的規劃部署,通過有機整合,能夠較為容易地同時滿足科學性、先進性、穩定性、經濟性等需求,也更容易去適應政府、金融、電信、互聯網、大企業等不同行業應用需求,讓計算系統智能化得以實現。
3.算力集群規模化部署,提升產業落地效能。
如果說傳統武術與跆拳道搏擊等現代武術相比有什么不同,那么現代武術更接近工業化、標準化的培養模式,而傳統武術只能靠師傅教徒弟這種“人傳人”模式培養,從規模和效率角度看顯然不占優勢。同樣,數智化轉型也帶動了諸如智慧城市圈、智能化工廠聚集區、大學高性能計算實驗室、電子商務產業園、大灣區數字經濟等等一批產業集群,針對這些集群提供針對性、極致性能的算力解決方案,無疑提升計算系統的功耗比。
因此,華為在2019年就開始打造鯤鵬、昇騰產業生態,通過AI算力集群來賦能產業集群,實現智能計算的規模化、極致化應用。比如華為Atlas 產品就因為具備良好的集群性,可以將集群損耗降到同類產品最低,能夠更好地支撐諸如智慧城市等規模化分布式并行計算的需求。
在實踐中,華為提供基于Atlas AI服務器和ISV應用軟件的一體化解決方案,幫助深圳交警建構了城市交通大腦,通過Atlas硬件搭建了一朵視頻云,實現彈性調度和視頻數資源池化,用來進行視頻管理和視頻分析。在邊緣部署攝像機,交管部門可廣泛采集人、車、物等信息,提高城市立體化、動態化防控能力。從“散裝模式”走向“集群作戰”,也為智能計算產業探索出了一種更加節能綠色的路徑。
經世致用,敢為人先:華為的算力武學
中國思想家黃宗羲曾經在《明夷待訪錄·兵制》篇中,著重提到武學的根本是“經世之學”“致用”。如今,多樣性算力就如同武學一樣,成為興國興邦的時代選擇。如何讓算力基礎設施建以致用、賦能新基建,是擺在ICT產業面前的核心命題。解決了傳統高性能計算與智能需求融合的既有問題之后,多樣性算力想要走進千行萬業,變成“經世致用”,需要面對的現實是:
AI應用面對著無數差異化場景,意味著通用型解決方案力有不逮;復雜數據、邊緣硬件、云端協作,需要對計算、存儲、網絡在內的系統進行綜合考量,來架設計算系統等等。對于華為來說,拿下“大數據和智能計算領軍企業”殊榮固然重要,但更重要的是擔當起引領產業發展、提供破局密碼的責任。因此在此次大會上,華為集群計算產業發展總監謝海波博士也提出,應該重視應用的“可獲得算力”,形成“建以致用”的產業共識,以多樣性算力承載“新基建”多樣性業務需求。通過“政產學研用”五位一體的方式,共建“新基建”多樣性算力的生態。
具體應該怎么做呢?我們在華為的新計算中看到了一種兼具現實主義和浪漫主義的“暴力美學”。
一是應用。讓大規模AI計算以一體化的信息化解決方案,讓千行千面的算力需求攻無不克。目前,鯤鵬大數據解決方案已經廣泛部署和應用于電信、政府、金融等行業,以鯤鵬與浙江移動的合作為例,2019年,浙江移動相繼完成了IT云鯤鵬服務器測試,營業廳前臺系統、CRM、計費、大數據、CDN等系統的驗證及上線商用。這其中,浙江移動的CRM& BOSS系統在鯤鵬大數據方案支撐下,整體得到了較大提升,在規模承載網絡運營支撐業務的情況下,該系統現在已經穩定運行一年。
目前,浙江移動圍繞網絡云,IT云和移動云,已經打造了全球首個運營商領域ICT全場景樣板點。在政務云平臺的建設過程中,也需要充分考慮不同類業務的實際需求,實現靈活部署。不久前上線的“壯美廣西·玉林政務云(鯤鵬云)”,就依托鯤鵬的大數據解決方案,推出了廣西首個市級公共數據開放管理辦法,在全市推廣數字政務一體化應用。
可以說,正是支持多種計算形態,從終端、邊緣、云端全面的解決方案,將碎片化計算資源進行整合的通盤方案,讓AI算力有了落地各個產業的現實基礎。
二是開放。如果沒有軟件端、開發端等ISV伙伴來將AI算力進行有效落地,那么再高性能也只能埋沒在數據中心里。于是我們看到,華為通過支持鯤鵬和X86混合部署、基礎軟件生態開源等,為開發者提供覆蓋端、邊、云的全場景開發框架。上汽大眾就采用TaiShan服務器構建研發HPC平臺,針對開源 OpenFOAM軟件進行調優,將研發效率提升了30%以上;日本U-NEXT基于TaiShan服務器構建視頻內容存儲平臺,三年TCO整體可降低約20%。
通過對開發生態的賦能與扶持,各行各業正在華為的算力土壤上運掉自如,凌空飛翔。開放化的作風,也讓華為得以在計算領域“開宗立派”,成為標桿。而新基建所需要的算力,也得以用武俠般飄然若仙的姿態,飛揚在城市上空,并有希望將所有人帶入未來奇景之中。
fqj
-
AI
+關注
關注
87文章
30728瀏覽量
268892 -
智能計算
+關注
關注
0文章
177瀏覽量
16460
發布評論請先 登錄
相關推薦
評論