來源:愛集微
在數字經濟化時代,算力就是生產力。隨著以算力為核心的科技競爭成為當前大國競爭的戰略焦點,把握算力發展的重大戰略機遇期就是搶占發展的主動權和制高點。
作為新型生產力,算力的迅猛發展離不開芯片、數據中心和云計算等產業鏈的日臻完善,特別是作為三大算力芯片之一的GPU,更是兵家必爭之地。而由GPU衍生出來的GPGPU憑借并行計算理念打造出強大的高性能通用計算優勢,在算力時代正風生水起。
有算力時代繪就的宏偉GPGPU藍圖召喚,有英偉達一飛沖天的傳奇激勵,疊加中國進口替代以及科創板的杠桿效應,資本對GPGPU賽道高度興奮,一眾初創公司亦相繼涌現,爭相登高一呼,要在融資、量產、應用層面試比高,也讓這一賽道端得熱鬧非凡。
但要警醒的是,與GPGPU高熱相伴的是圈內的浮躁風、套殼風和虛夸風不止。而在波譎云詭的國際形勢面前一系列熱點事件的發酵,更讓業界關注國產GPGPU的真實“成色”。穿越GPGPU的重重迷霧,到底該如何解鎖國產GPGPU的真功夫?
補位迫切國產GPGPU迎來新考驗
經過多年的積淀,中國作為算力發展的“領跑者”,已在算力競逐中走到世界前列。
截至2022年6月,中國數據中心機架總規模超過590萬臺,服務器規模約2000萬臺,算力總規模超過150 EFlops,位列全球第二。有機構預測到2025年,中國GPGPU市場規模將達到458億元,相較于2019年的86億元增長5倍多。
但在巨大的市場規模背后,折射的卻是GPGPU難言的尷尬境地。英偉達、AMD雙雄憑借多年構筑的護城河優勢,壟斷了中國GPGPU的90%市場。隨著GPGPU應用在云計算、大數據、工業、安防、HPC等市場蔚然成風,無論是中國自身算力的大發展,還是國產高端大芯片的自主化率提升,國產GPU不能也不應在這一賽道上缺席太久。
加之中美科技戰愈加嚴峻,特別是英偉達禁售A100事件發生以來,國產GPGPU“替代”之路將不斷加快,如何做強成為新的考驗。
特別是黨的二十大報告也提出,以國家戰略需求為導向,集聚力量進行原創性引領性科技攻關,堅決打贏關鍵核心技術攻堅戰。GPGPU作為國內急待突破的高端芯片之一,必然要走上自主化道路。
近幾年國內GPGPU公司乘著政策、資本、人才和應用的東風相繼涌現,除了一眾老將之外,包括珠海芯動力、壁仞、沐曦、登臨、天數智芯、紅山微電子、瀚博半導體等新勢力集結發力,或在自研架構層面的高算力高靈活性發力;或在生態打造上可圈可點;或在應用上開疆拓土,在某些特定應用領域也在加快落地。
而在進軍的長征路上,一些急功近利的心態、大鳴大放的風格也在無形之中對國產GPGPU的發展產生了阻礙。到底該如何丈量國產GPGPU的“成色”?未來的發展之路究竟應如何走?
架構創新 打造高性能低功耗
作為高端芯片代表,研發GPGPU顯然是一項極其復雜的系統性工程,涉及硬件架構、驅動開發、軟件生態、應用適配等,正是關關難過關關過。
特別是GPGPU需設置大量的計算單元,將大量計算單元進行適當組合并實現極高的計算效率難度極大,而且GPGPU的多元化應用要求GPGPU“兼顧”高算力、低功耗、靈活性,這對底層的核心硬件架構提出了更嚴格的要求。
目前國內GPGPU廠商的核心架構大多自研,這是一條艱難而正確的道路。正如有行業人士分析稱,走到頂峰的一定是采取自研架構的路線,只有能夠把整個架構掌握實現自研,才能夠追趕頭部玩家,才有可能在未來進行超越。
珠海市芯動力科技有限公司(簡稱芯動力)創始人李原也指出,為實現大量的計算、流水線的排列方式,需要GPGPU采用大量處理單元陣列的可重構計算架構,這樣才可滿足高算力的需求,同時保持低功耗和硅面積高效。
知行合一,在經過長期的摸索和不斷的探索之后,芯動力創新性地開發了兼顧能效與編程靈活性的可重構并行處理器芯片架構RPP(可重構并行處理器),吹響了向GPGPU進軍的號角。
厚積而薄發,RPP的架構優勢也十分顯著:支持大量的并行線程,通過采用空間處理器架構,把RPP指令分發到空間上不同的PE陣列里面,并按照指令的依賴關系連接起來,當大量數據流過PE陣列時,以流水線的方式完成計算。此外,因RPP處理器設計的高效性,可以在同樣的芯片面積上放入更多的片上內存,在計算時候可以實現數據的最小距離搬運,大大降低功耗,實現了低功耗存算一體化。
(RPP架構圖)
整體而言,利用RPP架構的優越性,可達到更高的算力、更低的功耗,從而降低服務器的部署和運維成本。
在架構層面厚積薄發之后,芯動力乘勝出擊,采用空間流水線架構、原生支持CUDA生態的第一代產品RPP-R8已成功流片,并面向客戶送樣及銷售。
據悉,RPP-R8除了具備專用芯片所沒有的通用編程性,面積效率比可達到英偉達同類產品的7~10倍,能效比也超過3倍,可滿足高效并行計算及AI計算應用。
兼容主流生態切入邊緣應用場景
要在GPGPU領域通關,生態至關重要。而且,GPGPU的生態非常復雜,要求一路打通到應用層,提供面向應用的全面支持。
因英偉達CUDA生態盛行,國內不少GPGPU初創公司初期大都在走兼容CUDA生態的道路。在這方面,RPP也以獨有的底層硬件架構實現了對CUDA語言的支撐,原生支持CUDA生態。芯動力自主開發工具鏈,擁有獨立的SIMT指令集與后端編譯器,在cuDNN與TensorRT上實現了API兼容;支持廣泛AI框架如TensorFlow、Pythorch,。
李原認為,通過兼容CUDA語言,通過自有的指令集和開發工具進行深度優化性能,在高性能計算領域內RPP-R8可以得到最廣泛使用的編程語言的支持,不僅從底層的軟件兼容,而且從它的調用形式、用戶的感知方面也兼容并帶來更好的體驗。
實現兼容之后,芯動力擁有了GPGPU應用之門的“鑰匙”。GPGPU的應用場景廣泛,如何滿足客戶的差異化需求?特別是國產GPGPU實力還相對較弱的情形下,如何走農村包圍城市的路線?
“這就要求從客戶的角度來看,幫助客戶解決了什么痛點?而市場需要的是能夠幫助客戶快速的完成他們的產品,也就是Time to Market。”李原判斷。
看準這一動向,芯動力謀定而后動。RPP-R8的特點非常適用在高密度數據量的邊緣計算場景,因此,芯動力科技選擇從邊緣計算市場如工業視覺、輔助駕駛、安防等領域切入。
近年來,安防行業越來越多數據從云中心遷移到“邊緣”上,RPP-R8在安防的應用場景中優勢也讓芯動力在這一市場斬獲豐實。此外,隨著智能制造業的智能化需求在不斷提升,芯動力的應用拓展也延伸到了工業視覺領域,得到了廣泛的認可。
此外,RPP-R8具備的高性能和通用可編程性還可不斷加快客戶Time to Market的步伐。一家采用RPP-R8進行信號處理的客戶直陳說:“RPP-R8芯片對公司的意義不僅僅是一個產品一個項目,而是解決公司長遠問題的一顆芯片。”不僅如此,他們還希望把整個公司的產品都基于RPP-R8芯片來設計使用,這樣就可以從繁瑣而耗時的FPGA硬件開發中解脫出來,從而得以專心研發系統軟件和算法,通過使用通用的并行計算芯片,使產品快速上市。
在GPGPU的激蕩歲月,國內GPGPU廠商就要選擇一條為客戶創造價值的道路,這樣才能成就自身的價值,才能行穩致選。芯動力將這一DNA貫穿于創新、優化和應用的全過程,也收獲了新的勢能。
在RPP-R8芯片的應用正在多點開花之際,芯動力對于未來也有了更明確的規劃。李原表示,市場在迅速地變化,地緣政治的因素對行業影響非常大,芯動力要能應對這些變化,并在變化之中找到機會。芯動力也將花費更多的時間打磨,無論是架構、生態還是應用層面都要更上一層樓。也希望在今后的發展過程當中,能夠得到更多的行業和生態系統合作伙伴的支持,一起去共同促進國產GPGPU的發展。
結語:
在當前充滿競爭且空前復雜的市場形勢之下,國產GPGPU業的發展注定是曲折的。
盡管面臨重重險阻,但在國家相關政策及產業資金的傾斜下,最后的成功唯取決于中國無數公司的努力,取決于技術的創新,取決于堅持的長久。
還要看到的是,GPGPU的研發牽一發而動全身,需要的不僅僅是架構迭代與生態打造,還需要光刻機等配套產業的同步提升,才能縮短與國際領先水平之間的差距。此外,兼容是捷徑,但不是終點,從長遠來說一定要建立自己的生態。國內GPGPU廠商還應風物長宜放眼量。
無疑,美對我國半導體業的全面圍剿也將不斷加速國產芯片自主化的進程,但要從弱到強,從低端到高端,顯然是一場以數年為計的長征之路。
審核編輯黃昊宇
-
gpu
+關注
關注
28文章
4733瀏覽量
128911
發布評論請先 登錄
相關推薦
評論