伊人天堂网,一区二区三区免费高清视频,在线亚洲综合

電子發(fā)燒友網(wǎng)報道（文/周凱揚）從去年國產(chǎn)GPU開始陸續(xù)冒尖后，今年各大廠商的動作明顯更大了一些，新品頻繁面世。但從這些新品的規(guī)格和技術(shù)來看，其實每家公司對于自己GPU產(chǎn)品的定位都是不同的，我們就選幾家國產(chǎn)GPU廠商來分析一下他們的產(chǎn)品定位以及未來技術(shù)趨勢。

摩爾線程

作為近期剛發(fā)布了新品的國產(chǎn)GPU廠商，摩爾線程確實收獲了不少關(guān)注，他們最新的顯卡MTT S80也一度成了熱點話題。MTT S80作為一張游戲顯卡，搭載了MT-春曉芯片核心，功耗最高250W，單精度浮點算力高達14.4TFLOPS。

不僅如此，MTT S80也是業(yè)內(nèi)首個PCIe 5.0的顯卡，支持雙向128GB/s的傳輸帶寬。更重要的是，哪怕標榜的是游戲顯卡，MTT S80依然支持3D圖形渲染、智能多媒體、物理仿真及科學(xué)計算和AI計算加速的全功能應(yīng)用。

MTT S3000 / 摩爾線程

除了MTT S80以外，春曉這一芯片也為摩爾線程帶來了面向服務(wù)器GPU市場的新產(chǎn)品，MTT S3000。單從芯片規(guī)格上來看，MTT S3000與MTT S80都用的是完整的MT-春曉芯片，都內(nèi)置了4096個MUSA流處理單元，但前者將主頻提高到了1.9GHz，F(xiàn)P32也因此提升到了15.2TFLOPS。

為了讓MTT S3000更適用于服務(wù)器市場，摩爾線程也將其顯存提升至了32GB，并增加了對虛擬化的支持，可對GPU彈性切分，MTT S3000也從MTT S80的主動散熱改為了被動散熱。

到了AI上，摩爾線程的MUSA架構(gòu)和軟件棧為MTT S3000提供了訓(xùn)推一體的支持。除了訓(xùn)練支持TensorFlow、PyTorch、飛槳等常見框架外，摩爾線程還在推理上打造了自研AI推理引擎TensorX，甚至推出了兼容CUDA源碼的方案。

可以看出，摩爾線程不僅已經(jīng)在游戲GPU市場有了彌足珍貴的進展，同樣想在服務(wù)器市場實現(xiàn)突破，甚至是通過兼容CUDA來吸引更多的客戶，這其實也是英偉達這樣的GPU巨頭主攻的兩大方向。但兼容或?qū)薈UDA一法，AMD、英特爾這樣的國際大廠也都在推進，卻也都是各自為戰(zhàn)，考慮到其中涉及的開發(fā)投入和難度之大，或許在軟件生態(tài)上走合作之路會更適合。

芯動科技

在使用GPU這類產(chǎn)品的過程中，支持不同的圖形與計算API對于開發(fā)者來說尤為重要。而芯動科技的風(fēng)華GPU在這API上的支持尤為亮眼，目前已經(jīng)完美支持到OpenGL 4.3、OpenGL ES 3.2、Vulkan 1.2和OpenCL 3.0，這也為風(fēng)華GPU的開發(fā)生態(tài)奠定了基礎(chǔ)。

芯動高性能接口IP / 芯動科技

雖然其產(chǎn)品性能本身已經(jīng)足夠亮眼，但風(fēng)華GPU真正最大的優(yōu)勢在于芯動自研高性能接口IP上，包括高帶寬內(nèi)存（GDDR6x、HBM3）、高速SerDes（PCIe 5.0、CXL 2.0）和高清多媒體（HDMI 2.1、eDP 1.4）等等，同時這些IP也實現(xiàn)了對先進工藝的覆蓋。而且芯動科技已經(jīng)在最近推出了跨工藝、跨封裝的Chiplet互聯(lián)解決方案Innolink Chiplet，同時兼容UCIe Chiplet。

對于高性能GPU來說，如果說核心IP決定了性能上限的話，那么這些接口IP就決定了GPU能發(fā)揮出多少實力，以及是否能在未來的服務(wù)器市場大放異彩。目前看來，風(fēng)華2號的定位是一款低功耗的GPU產(chǎn)品，更適合用于智能座艙之類的應(yīng)用中，而風(fēng)華1號則是面向服務(wù)器市場，尤其是像云游戲、云手機之類的場景。

可從規(guī)格來看，這兩款一年以內(nèi)發(fā)布的產(chǎn)品其實都還沒有用到PCIe 5.0之類的新接口技術(shù)。芯動科技已經(jīng)在8月公開表示，風(fēng)華3號也已經(jīng)基本完成研發(fā)，還支持光線追蹤技術(shù)，據(jù)了解該產(chǎn)品和風(fēng)華1號一樣也是面向服務(wù)器/數(shù)據(jù)中心市場的，但或許還是會側(cè)重在云游戲等商用場景上，相信我們會在未來的發(fā)布上看到風(fēng)華3號更強大的性能表現(xiàn)。

壁仞科技

雖然壁仞科技最近遇上了一些麻煩，但不可否認的是，其BR100系列通用GPU芯片確實在性能上達到了極高的水準。與上面提到的兩個GPU不同，BR100雖然是通用計算GPU，但明顯更適合于AI和科學(xué)計算這樣的高性能計算場景，所以BR100并沒有去做DirectX和Vulkan這樣的圖形API支持。

這點從BR100的芯片設(shè)計上也能看出，單個BR100由16個流處理簇構(gòu)成，每個都采用了16個執(zhí)行單元的設(shè)計，而每個執(zhí)行單元包含16個流處理核心（V-core）和一個向量引擎（T-Core）。V-Core作為SIMT處理器，支持到FP32、FP16、INT32、INT16，用于通用計算。

而T-core在SPC級別的2.5D GEMM架構(gòu)下，可以極大加速常見的AI運算，諸如MMA矩陣乘加和卷積等。T-Core不僅支持FP32、TF32這些主流數(shù)據(jù)精度外，還原創(chuàng)定義了TF32+數(shù)據(jù)精度，相較TF32在實現(xiàn)更高精度的同時，也提高了吞吐性能。

從軟件平臺上看，壁仞科技的BIRENSUPA不僅支持PyTorch之類的主流框架，也有壁仞自研的推理加速引擎。從BIRENSUPA平臺框圖中的應(yīng)用定位來看，壁仞科技的主要發(fā)力方向看來還是多媒體、自動駕駛和推薦系統(tǒng)等重AI的場景。

壁仞100P OAM模組 / 壁仞科技

壁仞科技也是在一眾國產(chǎn)PCIe產(chǎn)品中，唯一推出了OAM模組的廠商，壁仞科技也和浪潮合作推出了“海玄”這種OAM服務(wù)器，實現(xiàn)了8PFLLOPS的峰值算力。不過也正是因為實現(xiàn)了如此高的性能，似乎招致了一些惡意阻礙，但這也恰恰說明了他們走的方向是對的，如果他們能走出這一困境的話，無疑能在服務(wù)器市場大有作為。

聲明：本文由電子發(fā)燒友原創(chuàng)，轉(zhuǎn)載請注明以上來源。如需入群交流，請?zhí)砑游⑿舉lecfans999，投稿爆料采訪需求，請發(fā)郵箱huangjingjing@elecfans.com。

更多熱點文章閱讀

董明珠：格力為特斯拉供應(yīng)底盤裝備，白電企業(yè)對“造車”達成共識？
俄羅斯生產(chǎn)首顆純國產(chǎn)通信衛(wèi)星！俄衛(wèi)星實力有多強？
歐盟統(tǒng)一充電接口！蘋果：確定改用USB-C！
Marvell大幅裁撤中國研發(fā)團隊，但另一市場正加大在華投資
警惕！德州儀器：芯片需求疲軟，正從消費電子蔓延至工業(yè)領(lǐng)域！

原文標題：AI、游戲與通用計算，國產(chǎn)GPU的定位

文章出處：【微信公眾號：電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

電子發(fā)燒友網(wǎng)

電子發(fā)燒友網(wǎng)

+關(guān)注

關(guān)注
1010

文章
544

瀏覽量
164398

原文標題：AI、游戲與通用計算，國產(chǎn)GPU的定位

文章出處：【微信號：elecfans，微信公眾號：電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

CPU\GPU引領(lǐng)，國產(chǎn)AI PC進階

電子發(fā)燒友網(wǎng)報道（文/黃晶晶）當前AI PC已經(jīng)成為PC產(chǎn)業(yè)的下一個浪潮，國產(chǎn)CPU、GPU廠商在PC市場一直處于追趕態(tài)勢，AI PC給了大家新的機遇，在這個賽道

發(fā)表于 09-01 02:15 ?5067次閱讀

$CPU\GPU引領(lǐng)，國產(chǎn)AI PC進階$

GPU是如何訓(xùn)練AI大模型的

在AI模型的訓(xùn)練過程中，大量的計算工作集中在矩陣乘法、向量加法和激活函數(shù)等運算上。這些運算正是GPU所擅長的。接下來，AI部落小編帶您了解GPU

發(fā)表于 12-19 17:54 ?87次閱讀

《CST Studio Suite 2024 GPU加速計算指南》

《GPU Computing Guide》是由Dassault Systèmes Deutschland GmbH發(fā)布的有關(guān)CST Studio Suite 2024的GPU計算指南。涵蓋GP

發(fā)表于 12-16 14:25

《算力芯片高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得：GPU革命：從圖形引擎到AI加速器的蛻變

場景精確投射到2D平面；最后在像素著色階段完成材質(zhì)渲染和光照明細處理。DirectX API的迭代推動了可編程著色器的發(fā)展，解放了GPU的通用計算潛能。特別是像素著色器的設(shè)計，啟發(fā)了我在深度學(xué)習(xí)任務(wù)中

發(fā)表于 11-24 17:12

GPU加速計算平臺是什么

GPU加速計算平臺，簡而言之，是利用圖形處理器（GPU）的強大并行計算能力來加速科學(xué)計算、數(shù)據(jù)分析、機器學(xué)習(xí)等復(fù)雜

發(fā)表于 10-25 09:23 ?245次閱讀

新的Arm GPU助力釋放消費電子設(shè)備市場中的游戲和AI創(chuàng)新潛能

作為人們?nèi)粘?shù)字生活中不可或缺的一部分，Arm GPU 賦能了從當今智能手機上的沉浸式游戲，到各類邊緣側(cè)人工智能 (AI) 體驗的方方面面。

發(fā)表于 05-30 11:47 ?723次閱讀

為什么GPU對AI如此重要？

GPU在人工智能中相當于稀土金屬，甚至黃金，它們在當今生成式人工智能時代中的作用不可或缺。那么，為什么GPU在人工智能發(fā)展中如此重要呢？什么是GPU圖形處理器（GPU）是一種通常用于進

發(fā)表于 05-17 08:27 ?684次閱讀

為什么跑AI往往用GPU而不是CPU？

GPU的能力，并且支持的GPU數(shù)量越多，就代表其AI性能越強大。那么問題來了，為什么是GPU而不是CPU？GPU難道不是我們?nèi)粘Ｊ褂玫碾娔X里

發(fā)表于 04-24 08:27 ?1871次閱讀

大模型時代，國產(chǎn)GPU面臨哪些挑戰(zhàn)

電子發(fā)燒友網(wǎng)報道（文/李彎彎）隨著人工智能技術(shù)的快速發(fā)展，對GPU計算能力的需求也越來越高。國內(nèi)企業(yè)也正在不斷提升GPU性能，以滿足日益增長的應(yīng)用需求。然而，相較于國際巨頭，國內(nèi)GPU

發(fā)表于 04-03 01:08 ?4663次閱讀

國產(chǎn)GPU在AI大模型領(lǐng)域的應(yīng)用案例一覽

電子發(fā)燒友網(wǎng)報道（文/李彎彎）近一年多時間，隨著大模型的發(fā)展，GPU在AI領(lǐng)域的重要性再次凸顯。雖然相比英偉達等國際大廠，國產(chǎn)GPU起步較晚、聲勢較小。不過近幾年，國內(nèi)不少

發(fā)表于 04-01 09:28 ?3787次閱讀

盤點國產(chǎn)GPU在支持大模型應(yīng)用方面的進展

，近些年國內(nèi)也有不少GPU企業(yè)在逐步成長，雖然在大模型的訓(xùn)練和推理方面，與英偉達GPU差距極大，但是不可忽視的是，不少國產(chǎn)GPU企業(yè)也在AI

發(fā)表于 03-29 00:27 ?6686次閱讀

FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈?b class='flag-5'>GPU

基礎(chǔ)設(shè)施，人們?nèi)匀粵]有定論。如果 Mipsology 成功完成了研究實驗，許多正受 GPU 折磨的 AI 開發(fā)者將從中受益。 GPU 深度學(xué)習(xí)面臨的挑戰(zhàn) 三維圖形是 GPU 擁有如此

發(fā)表于 03-21 15:19

硅光計算芯片：AI芯片國產(chǎn)化的關(guān)鍵突破口

大模型訓(xùn)練和推理的硬件以通用圖形處理單元（GPU）為主，2022年全球GPU市場規(guī)模達到448.3億美元，美國AI芯片巨頭英偉達公司占有80%的市場份額并仍在持續(xù)攀升。

發(fā)表于 01-19 14:12 ?5387次閱讀

GPU技術(shù)、生態(tài)及算力分析

對比AMD從2013年開始建設(shè)GPU生態(tài)，近10年時間后用于通用計算的ROCm開放式軟件平臺才逐步有影響力，且還是在兼容CUDA的基礎(chǔ)上。因此我們認為國內(nèi)廠商在軟件和生態(tài)層面與英偉達CUDA生態(tài)的差距較計算性能更為明顯。

發(fā)表于 01-14 10:06 ?1237次閱讀

如何能夠?qū)崿F(xiàn)通用FPGA問題？

FPGA 是一種偽通用計算加速器，與 GPGPU（通用 GPU）類似，F(xiàn)PGA 可以很好地卸載特定類型的計算。從編程角度上講，F(xiàn)PGA 比 CPU 更難，但從工作負載角度上講 FPGA

發(fā)表于 12-29 10:29 ?459次閱讀