在英偉達于2000年收購3DFX,以及AMD在2006年收購ATI之后,桌面GPU這個市場本來就已經塵埃落定。
英偉達是GPU市場當之無愧的巨頭,AMD的GPU則掙扎前行,而Intel則依靠其CPU的號召力,在集成顯卡市場擁有絕對的號召力,但在獨立顯卡市場,無論是之前的Intel 740還是后續的Larrabee都無疾而終。
但在Alex Krizhevsky使用英偉達GPU成功訓練出了深度卷積神經網絡AlexNet,并憑借該網絡在圖像分類識別領域大幅提升了性能之后。人工智能新時代正式開啟。也正是從這個時候開始,GPU市場開始進入了一個新階段。英偉達則成為這個時代當之無愧的大贏家。
英偉達叱咤AI時代的兩大利器
回看圖形處理器的發展史,據相關資料顯示,MIT在1951年制造的Whirlwind也許是世界上第一個3D圖形系統,但這不是現代GPU的基礎。據報道,現在的GPU雛形是基于上世紀70年代中期的所謂視頻移位器(video shifters)和視頻地址生成器(video address generators)組成的。
在歷經大型系統、小型工作站的發展后,圖像處理器在90年代中后期于PC上的3D游戲而發揚光大,在此期間,不少公司涌入其中,英偉達也是其中的一家。據英偉達官網介紹,在他們成立的1993年,全球有超過二十家的圖形芯片公司,到1997年,這個數字猛增至70家。但到2006年,英偉達是唯一仍在運營的獨立公司,他們也成為最后的贏家。被其沖上沙灘的前浪包括了ATI、S3 Graphics和3DFx等競爭對手。
和其他玩家一樣,英偉達最初成立的時候也只是聚焦于顯卡市場,最初推出的兩款產品NV1和NV2也市場反響平平平。但英偉達不氣餒,投入大量的經歷去研發NV3,并在1997年推出。作為全球首個128位3D處理器,NV3在推出四個月后的出貨就突破一百萬。因為NV3能對OpenGL的良好支持,英偉達自NV3開始,逐漸打敗了當時市場占比高達85%的3DFx,成為了顯卡市場的霸主。
值得一提的是,英偉達表示,他們在1999年發明了GPU( 這是NVIDIA首創的詞匯,GPU即是Graphics Processing Unit的縮寫),而當年推出GeForce 256就是全世界第一款GPU。
如果英偉達接下來,還是只盯著圖形市場,那么他們的充其量就就只是下一個3DFx,但黃仁勛有更大的野心,那就是把GPU推到通用市場,這就是大家所熟悉的GPGPU。
據半導體行業觀察之前的報道:“在2000年左右,學術界對于使用GPU做通用計算(GPGPU)產生了興趣。當時,主要面向執行通用算法的CPU是執行科學計算的主力,但是CPU為了能在通用算法上都有較好的性能,因此很多芯片面積事實上用在了片上內存和分支預測等控制邏輯,而真正用于計算的單元并不多。相反,GPU架構中的控制邏輯較為簡單,絕大多數芯片面積都用于渲染、多邊形等計算。學術界發現,科學運算中的矩陣等計算可以很簡單地映射到GPU的處理單元,因此能實現非常高的計算性能?!?/p>
報道進一步指出,當時,GPGPU最主要的瓶頸在于難以使用。由于GPU是面向圖像應用而開發,因此要在其編程模型中支持通用高性能計算并不容易,需要許多手工調試和編碼,因此造成了很高的門檻,能熟練使用的人并不多。
為了讓GPU從軟硬件都走向通用,英偉達在2006年推出了Tesla架構,一改之前使用矢量計算單元做渲染的做法,而是把一個矢量計算單元拆成了多個標量計算渲染單元。這就使得基于這個架構的GPU除了渲染能力強以外,還適合做通用計算。
也就是在這一年,英偉達推出了CUDA。按照他們的說法,這是一種用于通用GPU計算的革命性架構。CUDA將使科學家和研究人員能夠利用GPU的并行處理能力來應對其最復雜的計算挑戰。
正是得益于這兩個方向的布局,英偉達在AI時代如魚得水。
據行業專家所說,現在的云端AI芯片市場,除了谷歌自用的TPU外,其他絕大多數的廠商都是使用英偉達的GPU來做相關的模型訓練,這讓英偉達在云端AI芯片的市場居高不下。這也讓英偉達的業績在過去幾年屢創新高。根據賽迪顧文的預測數據顯示,光是國內的云端AI芯片市場,在2019年到2021年間的累計增長將高達152%,麥肯錫也預測,在未來幾年,訓練市場將成長迅猛,且在未來十年,這還將是英偉達GPU的天下。
看到這個數據需求和預測,國外就涌現出了類似Graphcore IPU和Google TPU等ASIC產品,計劃在訓練市場挑戰英偉達。Intel和AMD則希望在GPU硬扛英偉達。
AMD和Intel的蠢蠢欲動
其實早在英偉達進軍GPGPU的前后,AMD也有了相應的計劃。但和英偉達屬在過去多年里大力投入推行CUDA開發環境不一樣,AMD將雞蛋都放在了“OpenCL”這個籃子里面,這就導致即使他們在2017年發布了ROCm平臺來提供深度學習支持,但也改變不了他們GPU在AI時代幾無所獲的結局。
但AMD不甘心。為了與Nvidia競爭,AMD在今年三月份推出了新的CDNA架構。據介紹,這是AMD針對數據中心和其他用途的,專注于計算的GPU體系結構。AMD針對CDNA的目標既簡單又直接:構建一個大型的,功能強大的GPU系列,這些GPU針對一般的計算和數據中心使用進行了優化。
據介紹,新架構中很大一部分的性能提升將會體現在機器學習方面,這意味著支持更快地執行較小數據類型(例如INT4 / INT8 / FP16),而AMD在介紹新架構的時候也明確提到了張量運算。此外,新架構可以通過Infinity Fabric互連總線靈活設計性能,并支持增強的企業級RAS特性、安全、虛擬化技術,還將提供更高的能效比,從而降低企業TCO成本。
基于這個架構,AMD在本月中發布了新一代的Instinct MI100計算卡。數據顯示,新的架構可提供高達11.5 TFLOPS的FP64峰值吞吐量,這使其成為第一個在FP64中突破10 TFLOPS的GPU。與上一代MI50相比,新加速卡的性能提高了3倍。它還在FP32工作負載中擁有23.1 TFLOPS的峰值吞吐量。數據顯示,AMD的新加速卡在這兩個類別中都擊敗了Nvidia的A100 GPU。
Instinct MI100還支持AMD的新Matrix Core技術,該技術可提高FP32,FP16,bFloat 16,INT8和INT4等單精度和混合精度矩陣運算的性能,還可將FP32性能提高到46.1 TFLOPS。
為了更好地與英偉達競爭,AMD還表示,其開源ROCm 4.0開發人員軟件現在具有開源編譯器,并統一支持OpenMP 5.0,HIP,PyTorch和Tensorflow。
除了AMD外,Intel在最近幾年也加大在其GPU的投入,想在AI這個市場分一杯羹。
據英特爾介紹,公司的X e 架構GPU將覆蓋從集成顯卡到高性能計算的所有范圍。其中代號為Ponte Vecchio的獨立GPU則是公司面對HPC建模和仿真以及AI訓練而推出的設計。Ponte Vecchio將采用英特爾的7納米技術制造,并將成為英特爾首款針對HPC和AI工作負載進行了優化的基于X e 的GPU。但直到目前為止,尚未看到Intel的這款新品。
此外,為了更好地在包括AI在內的應用市場中發揮其包括CPU、GPU、FPGA和AISC在內的芯片的為例,方便開發者編程,Intel還推出了擁有遠達理想的OneAPI。在開發者看來,這是一個不錯的規劃,但同時也是一個極具挑戰的任務。
中國廠商加速入局
在GPU重要性日益凸顯的今日,國內越來越多的廠商開始投入到這個市場中去。這些廠商中除了有之前一直在這個市場布局的景嘉微、兆芯和航錦外,還有一些新進入這個領域的企業。當中尤其以壁仭、沐曦、海飛科、芯瞳最為知名。
首先看壁仞科技,據官網介紹,該公司創立于2019年,團隊由國內外芯片和云計算領域核心專業人員、研發人員組成,在GPU、DSA(專用加速器)和計算機體系結構等領域具有深厚的技術積累和獨到的行業洞見。
在產品方面,壁仞科技致力于開發原創性的通用計算體系,建立高效的軟硬件平臺,同時在智能計算領域提供一體化的解決方案。從發展路徑上,壁仞科技將首先聚焦云端通用智能計算,逐步在人工智能訓練和推理、圖形渲染、高性能通用計算等多個領域趕超現有解決方案,實現國產高端通用智能計算芯片的突破。
再看沐曦,則是由AMD前高管離職創立的公司。據介紹,沐曦集成電路成立于2020年9月,核心團隊來自世界一流的GPU芯片公司,平均擁有15年以上高性能GPU芯片設計經驗和豐富的5nm流片和7nm芯片量產經驗。公司致力于研發生產擁有自主知識產權的、安全可靠的高性能GPU芯片,服務數據中心、云游戲、人工智能等需要高算力的諸多重要領域,填補國內高性能GPU芯片自主可控的空白。
海飛科(Hexaflake)則成立于2019年,是一家高科技初創公司,致力于AI高性能處理器芯片和軟硬件全棧系統解決方案的研發,是能夠在該領域與國際巨頭并駕齊驅的頭部AI通用型處理器公司。主要創始人及核心團隊匯聚中美各地多位國際頂級資深專家;專長涵蓋并行計算與AI處理器體系架構、GPU等超大規模SoC芯片以及處理器系統軟件的研發;并曾在國際領先企業核心研發部門長期任職,成功研制多款芯片和系統產品。他們公司成立的目的是共同打造新一代通用型AI處理器芯片及其軟硬件生態環境。
芯瞳半導體成立于2018年。在接受媒體采訪的時候,他們表示公司的GPU瞄準的應用領域有三個方面:黨政八大行業(航空、戰車、雷達等)、軍隊和云游戲。此外,還有授權了Imagination IP的芯動、繼承了相關GPU專利的兆芯以及一直做國產CPU的龍芯也是GPU市場的玩家。
考慮到國內的GPU現狀和中美之間的貿易狀況,上述GPU廠商除了有看中AI市場的玩家外,也有希望在圖形GPU市場有突破的創業者。
不過正如行業專家告訴筆者,無論是在圖形還是通用計算市場,對于GPU而言,更重要的是軟件和開發者生態。只有做好了這個,才是GPU能夠商用的前提。國內廠商中何時會有廠商能夠真正突圍成功的?這值得我們觀望。
責任編輯:tzh
-
處理器
+關注
關注
68文章
19259瀏覽量
229652 -
cpu
+關注
關注
68文章
10854瀏覽量
211583 -
gpu
+關注
關注
28文章
4729瀏覽量
128890 -
AI
+關注
關注
87文章
30728瀏覽量
268886
發布評論請先 登錄
相關推薦
評論