今天這篇文章,我們來聊聊算力。 ? 這兩年,算力可以說是ICT行業的一個熱門概念。在新聞報道和大咖演講中,總會出現它的身影。 ? 那么,究竟到底什么是算力?算力包括哪些類別,分別有什么用途?目前,全球算力正處于怎樣的發展狀態?? ?
?什么是算力
算力的字面意思,大家都懂,就是計算能力(Computing Power)。 ? 更具體來說,算力是通過對信息數據進行處理,實現目標結果輸出的計算能力。 ?
? ? 我們人類,其實就具備這樣的能力。在我們的生命過程中,每時每刻都在進行著計算。我們的大腦,就是一個強大的算力引擎。 ? 大部分時間里,我們會通過口算、心算進行無工具計算。但是,這樣的算力有點低。所以,在遇到復雜情況時,我們會利用算力工具進行深度計算。 ? 遠古時期,我們的原始工具是草繩、石頭。后來,隨著文明的進步,我們有了算籌(一種用于計算的小棍子)、算盤等更為實用的算力工具,算力水平不斷提升。 ? 到了20世紀40年代,我們迎來了算力革命。 ? 1946年2月,世界上第一臺數字式電子計算機ENIAC誕生,標志著人類算力正式進入了數字電子時代。 ? ? ? 再后來,隨著半導體技術的出現和發展,我們又進入了芯片時代。芯片成為了算力的主要載體。
時間繼續推移。 ? 到了20世紀70-80年代,芯片技術在摩爾定律的支配下,已經取得了長足進步。芯片的性能不斷提升,體積不斷減小。終于,計算機實現了小型化,PC(個人電腦)誕生了。 ? ?
? PC的誕生,意義極為深遠。它標志著IT算力不再僅為少數大型企業服務(大型機),而是昂首走向了普通家庭和中小企業。它成功打開了全民信息時代的大門,推動了整個社會的信息化普及。 ? 在PC的幫助下,人們充分感受到IT算力帶來的生活品質改善,以及生產效率提升。PC的出現,也為后來互聯網的蓬勃發展奠定了基礎。 ? 進入21世紀后,算力再次迎來了巨變。 ? 這次巨變的標志,是云計算技術的出現。 ? ?
? 在云計算之前,人類苦于單點式計算(一臺大型機或一臺PC,獨立完成全部的計算任務)的算力不足,已經嘗試過網格計算(把一個巨大的計算任務,分解為很多的小型計算任務,交給不同的計算機完成)等分布式計算架構。 ? 云計算,是分布式計算的新嘗試。它的本質,是將大量的零散算力資源進行打包、匯聚,實現更高可靠性、更高性能、更低成本的算力。 ? 具體來說,在云計算中,中央處理器(CPU)、內存、硬盤、顯卡(GPU)等計算資源被集合起來,通過軟件的方式,組成一個虛擬的可無限擴展的“算力資源池”。 ? 用戶如果有算力需求,“算力資源池”就會動態地進行算力資源的分配,用戶按需付費。 ? 相比于用戶自購設備、自建機房、自己運維,云計算有明顯的性價比優勢。 ?
算力云化之后,數據中心成為了算力的主要載體。人類的算力規模,開始新的飛躍。 ?
?算力的分類
云計算和數據中心之所以會出現,是因為信息化和數字化的不斷深入,引發了整個社會強烈的算力需求。 ? 這些需求,既有來自消費領域的(移動互聯網、追劇、網購、打車、O2O等),也有來自行業領域的(工業制造、交通物流、金融證券、教育醫療等),還有來自城市治理領域的(智慧城市、一證通、城市大腦等)。 ? 不同的算力應用和需求,有著不同的算法。不同的算法,對算力的特性也有不同要求。 ? 通常,我們將算力分為兩大類,分別是通用算力和專用算力。 ?
大家應該都聽說過,負責輸出算力的芯片,就有分為通用芯片和專用芯片。 ? 像x86這樣的CPU處理器芯片,就是通用芯片。它們能完成的算力任務是多樣化的,靈活的,但是功耗更高。
FPGA,是可編程集成電路。它可以通過硬件編程來改變內部芯片的邏輯結構,但軟件是深度定制的,執行專門任務。 ? ASIC,是專用集成電路。顧名思義,它是為專業用途而定制的芯片,其絕大部分軟件算法都固化于硅片。 ? ASIC能完成特定的運算功能,作用比較單一,不過能耗很低。FPGA,介于通用芯片和ASIC之間。 ?
我們以比特幣挖礦為例。 ? 以前,人們都是用PC(x86通用芯片)挖礦,后來越挖難度越大,算力不夠。于是,開始使用顯卡(GPU)去挖礦。再后來,顯卡的能耗太高,挖出來的幣值還抵不上電費,就開始采用FPGA和ASIC集群陣列挖礦。 ? 在數據中心里,也對算力任務進行了對應劃分,分為基礎通用計算,以及HPC高性能計算(High-performance computing)。 ? HPC計算,又繼續細分為三類: ? 科學計算類:物理化學、氣象環保、生命科學、石油勘探、天文探測等。 工程計算類:計算機輔助工程、計算機輔助制造、電子設計自動化、電磁仿真等。 智能計算類:即人工智能(AI,Artificial Intelligence)計算,包括:機器學習、深度學習、數據分析等。 ? 科學計算和工程計算大家應該都聽說過,這些專業科研領域的數據產生量很大,對算力的要求極高。 ? 以油氣勘探為例。油氣勘探,簡單來說,就是給地表做CT。一個項目下來,原始數據往往超過100TB,甚至可能超過1個PB。如此巨大的數據量,需要海量的算力進行支撐。 ? 智能計算這個,我們需要重點說一下。 ? AI人工智能是目前全社會重點關注的發展方向。不管是哪個領域,都在研究人工智能的應用和落地。 ? 人工智能的三大核心要素,就是算力、算法和數據。 ?
大家都知道,AI人工智能是一個算力大戶,特別“吃”算力。在人工智能計算中,涉及較多的矩陣或向量的乘法和加法,專用性較高,所以不適合利用CPU進行計算。 ? 在現實應用中,人們主要用GPU和前面說的專用芯片進行計算。尤其是GPU,是目前AI算力的主力。 ? GPU雖然是圖形處理器,但它的GPU核(邏輯運算單元)數量遠超CPU, 適合把同樣的指令流并行發送到眾核上,采用不同的輸入數據執行,從而完成圖形處理或大數據處理中的海量簡單操作。 ? 因此,GPU更合適處理計算密集型、高度并行化的計算任務(例如AI計算)。 ? 這幾年,因為人工智能計算的需求旺盛,國家還專門建設了很多智算中心,也就是專門進行智能計算的數據中心。 ?
除了智算中心之外,現在還有很多超算中心。超算中心里面,放的都是“天河一號”這樣的超級計算機,專門承擔各種大規模科學計算和工程計算任務。 ? ? 我們平時看到的數據中心,基本上都屬于云計算數據中心。 ?
? 任務比較雜,基礎通用計算和高性能計算都有,也有大量的異構計算(同時使用不同類型指令集的計算方式)。因為高性能計算的需求越來越多,所以專用計算芯片的比例正在逐步增加。 ? 前幾年逐漸開始流行起來的TPU、NPU和DPU等,其實都是專用芯片。 ?
? 大家現在經常聽說的“算力卸載”,其實不是刪除算力,而是把很多計算任務(例如虛擬化、數據轉發、壓縮存儲、加密解密等),從CPU轉移到NPU、DPU等芯片上,減輕CPU的算力負擔。 ? 近年來,除了基礎通用算力、智能算力、超算算力之外,科學界還出現了前沿算力的概念,主要包括量子計算、光子計算等,值得關注。 ?
算力的衡量
算力既然是一個“能力”,當然就會有對它進行強弱衡量的指標和基準單位。大家比較熟悉的單位,應該是FLOPS、TFLOPS等。 ? 其實,衡量算力大小的指標還有很多,例如MIPS、DMIPS、OPS等。 ?
? MFLOPS、GFLOPS、TFLOPS、PFLOPS等,都是FLOPS的不同量級。具體關系如下: ?
浮點數有FP16、FP32、FP64不同的規格 ? 不同的算力載體之間,算力差異是非常巨大的。為了便于大家更好地理解這個差異,小棗君又做了一張算力對比表格: ?
? 前面我們提到了通用計算、智算和超算。從趨勢上來看,智算和超算的算力增長速度遠遠超過了通用算力。 ? 根據GIV的數據統計,到2030年,通用計算算力(FP32)將增長10倍,達到3.3 ZFLOPS。而AI智算算力(FP16),將增長500倍,達到105 ZFLOPS。 ?
算力的現狀與未來
早在1961年,“人工智能之父”約翰·麥卡錫就提出Utility Computing(效用計算)的目標。他認為:“有一天,計算可能會被組織成一個公共事業,就像電話系統是一個公共事業一樣”。 ? 如今,他的設想已經成為現實。在數字浪潮下,算力已經成為像水、電一樣的公共基礎資源,而數據中心和通信網絡,也變成了重要的公共基礎設施。 ? 這是IT行業和通信行業辛苦奮斗大半個世紀的成果。???? ? 對于整個人類社會來說,算力早已不是一個技術維度的概念。它已經上升到經濟學和哲學維度,成為了數字經濟時代的核心生產力,以及全社會數智化轉型的基石。
? 我們每個人的生活,還有工廠企業的運轉,政府部門的運作,都離不開算力。在國家安全、國防建設、基礎學科研究等關鍵領域,我們也需要海量的算力。 ? 算力決定了數字經濟發展速度,以及社會智能發展高度。 ? 根據IDC、浪潮信息、清華大學全球產業研究院聯合發布的數據顯示,計算力指數平均每提高1點,數字經濟和GDP將分別增長3.5‰和1.8‰。 ?
? 全球各國的算力規模與經濟發展水平,已經呈現出顯著的正相關關系。一個國家的算力規模越大,經濟發展水平就越高。 ?
世界各國算力和GDP排名 (來源:遲九虹,華為算力時代峰會演講) ? 在算力領域,國家之間的競爭博弈日益激烈。 ? 2020年,我國算力總規模達到135 EFLOPS,同比增長55%,超過全球增速約16個百分點。目前,我們的絕對算力,排名世界第二。 ? 但是,從人均角度來看,我們并不占優勢,僅處于中等算力國家水平。 ?
世界各國人均算力對比 (來源:唐雄燕,華為算力時代峰會演講) ? 尤其是在芯片等算力核心技術上,我們與發達國家還有很大的差距。很多掐脖子技術未能解決,嚴重影響了我們的算力安全,進而影響了國家安全。
所以,腳下的路還有很長,我們還需要繼續努力。 ?
未來社會,信息化、數字化和智能化將會進一步加快。萬物智聯時代的到來,大量智能物聯網終端的引入,AI智能場景的落地,將產生難以想象的海量數據。 ? 這些數據,將進一步刺激對算力的需求。 ? 根據羅蘭貝格的預測,從2018年到2030年,自動駕駛對算力的需求將增加390倍,智慧工廠需求將增長110倍,主要國家人均算力需求將從今天的不足500 GFLOPS,增加20倍,變成2035年的10000 GFLOPS。 ? 根據浪潮人工智能研究院的預測,到2025年,全球算力規模將達6.8 ZFLOPS,與2020年相比提升30倍。 ? 新一輪的算力革命,正在加速啟動。 ? ?
結語
? 算力是如此重要的資源,但事實上,我們對算力的利用仍然存在很多問題。 ? 比如算力利用率問題,以及算力分布均衡性問題。根據IDC的數據顯示,企業分散的小算力利用率,目前僅為10%-15%,存在很大的浪費。 ? 摩爾定律從2015年開始放緩,單位能耗下的算力增速已經逐漸被數據量增速拉開差距。我們在不斷挖掘芯片算力潛力的同時,必須考慮算力的資源調度問題。 ? 那么,我們該如何對算力進行調度呢?現有的通信網絡技術,能夠滿足算力的調度需求嗎? ? ?
編輯:黃飛
評論
查看更多