一级做a爱过程免费视频韩国,宅男视频免费,在线观看片中文在线

蓬勃發(fā)展的機(jī)器學(xué)習(xí)和人工智能新興用例有望通過(guò)加速信息處理和提高決策準(zhǔn)確性為行業(yè)創(chuàng)造重大價(jià)值。但機(jī)器學(xué)習(xí)模型是計(jì)算密集型、需要高頻和實(shí)時(shí) AI 分析場(chǎng)景，這導(dǎo)致企業(yè)依賴(lài)于使用每秒萬(wàn)億次操作 (TOPS) 指標(biāo)的性能指導(dǎo)。TOPS 捕捉到“加速器在一秒鐘內(nèi)可以提供多少數(shù)學(xué)運(yùn)算？” 比較和確定給定推理任務(wù)的最佳加速器。

雖然 TOPS 是一個(gè)“容易”計(jì)算的指標(biāo)，但它通常無(wú)法為實(shí)際工作負(fù)載提供可靠的性能指標(biāo)。受限于加速器中乘法器和加法器的數(shù)量，該指標(biāo)無(wú)法考慮處理神經(jīng)網(wǎng)絡(luò)模型的計(jì)算硬件結(jié)構(gòu)。隨著數(shù)據(jù)網(wǎng)絡(luò)模型更快地處理數(shù)據(jù)，企業(yè)如何通過(guò)更快、更可靠的決策進(jìn)行擴(kuò)展，尤其是在邊緣？

在這篇文章中，我們將回顧 TOPS、它在測(cè)量延遲方面的挑戰(zhàn)以及它與現(xiàn)實(shí)世界的性能計(jì)算有何不同，并提供一種通過(guò)基準(zhǔn)測(cè)試來(lái)計(jì)算性能的替代方法，它提供了一種更可靠的方法來(lái)解釋計(jì)算硬件結(jié)構(gòu)。

TOPS 作為績(jī)效衡量標(biāo)準(zhǔn)的現(xiàn)實(shí)

TOPS 是一個(gè)簡(jiǎn)化指標(biāo)：它告訴您 AI 加速器在一秒鐘內(nèi)可以處理多少計(jì)算操作，并且利用率為 100%。本質(zhì)上，它著眼于加速器可以在很短的時(shí)間內(nèi)解決多少數(shù)學(xué)運(yùn)算問(wèn)題。

例如，如果一個(gè) AI 加速器提供 5 TOPS，另一個(gè)提供 15 TOPS，則推斷后者比前者快三倍。但是，就像 CPU 速度的兆赫茲和千兆赫茲一樣，TOPS 也失去了確定整體計(jì)算機(jī)性能的相關(guān)性。隨著人們對(duì) AI 應(yīng)用的興趣日益濃厚，最新的 AI 加速器可以比簡(jiǎn)單的算術(shù)更快地處理數(shù)據(jù)，并且更復(fù)雜。

然而，TOPS 很少準(zhǔn)確地捕捉到 AI 處理器在整個(gè)硬件設(shè)備中的重要性。如今，相機(jī)、邊緣服務(wù)器和計(jì)算機(jī)中的 AI 處理器通常是決定計(jì)算能力和能源效率的關(guān)鍵組件之一。事實(shí)上，TOPS 未能考慮到現(xiàn)實(shí)世界的工作量。通常，由于諸如空閑計(jì)算機(jī)單元等待來(lái)自?xún)?nèi)存的數(shù)據(jù)、加速器不同部分之間的同步開(kāi)銷(xiāo)和控制開(kāi)銷(xiāo)等因素，實(shí)際性能可能會(huì)顯著低于 TOPS 值。根據(jù)加速器的架構(gòu)和工作負(fù)載特性，

更高的 TOPS 不等于更高的性能

雖然較高的 TOPS 值可以表示具有更多計(jì)算元素的更大 AI 加速器，但現(xiàn)實(shí)情況可能恰恰相反。更高的 TOPS 通常會(huì)導(dǎo)致更大的加速器具有更多的計(jì)算元素和內(nèi)存塊，以將數(shù)據(jù)饋送到這些計(jì)算單元，這會(huì)導(dǎo)致更高的成本和功耗。另一方面，高效的加速器使用較少數(shù)量的計(jì)算資源提供更高的性能，因此 TOPS 評(píng)級(jí)較低。最終，理想的 AI 加速器是使用低 TOPS 提供高性能的加速器。

TOPS 不包括所有計(jì)算類(lèi)型

TOPS 指標(biāo)考慮了加速器的乘法器和加法器，這通常會(huì)導(dǎo)致性能指標(biāo)不準(zhǔn)確，因?yàn)榧铀倨骺梢該碛谐酥獾钠渌?jì)算資源。例如，Kinara 的架構(gòu)采用歸約樹(shù)而不是加法器陣列，從而顯著降低能耗。由于在此計(jì)算中未捕獲歸約樹(shù)的計(jì)算能力，TOPS 指標(biāo)將不夠準(zhǔn)確。ResNet50、MobileNet V1 和 YOLO_v3 等標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)在比較不同的加速器時(shí)非常有用，因?yàn)樗鼈円部梢杂米鳌安聹y(cè)”給定加速器是否能夠滿(mǎn)足開(kāi)發(fā)人員自身工作負(fù)載需求的代理。

推理延遲是評(píng)估 AI 加速器性能的指標(biāo)

對(duì)于在 Edge AI 上進(jìn)行投資的企業(yè)，通過(guò)基準(zhǔn)測(cè)試計(jì)算性能提供了一種可靠的方法來(lái)計(jì)算計(jì)算硬件結(jié)構(gòu)與 TOPS。由于大多數(shù)實(shí)際應(yīng)用程序需要極快的推理時(shí)間，因此衡量性能的最佳方法是運(yùn)行特定的工作負(fù)載，通常是 ResNet-50、EfficientDet、Transformer 或自定義模型，以了解加速器的效率。使用不同類(lèi)型、大小、拓?fù)浜洼斎敕直媛实木W(wǎng)絡(luò)進(jìn)行實(shí)時(shí)處理，可以得出推理延遲度量。該指標(biāo)計(jì)算加速器完成一個(gè)特定 AI 模型的干擾的執(zhí)行時(shí)間。

隨著 AI 工作負(fù)載及其支持計(jì)算架構(gòu)的發(fā)展，通過(guò)準(zhǔn)確的性能測(cè)量確保其可預(yù)測(cè)性具有重大影響，可以引導(dǎo)開(kāi)發(fā)人員做出更優(yōu)化的決策。通過(guò)使用推理延遲計(jì)算，它有助于處理和預(yù)測(cè)現(xiàn)代 AI 工作負(fù)載中的數(shù)據(jù)流，即使這些工作負(fù)載碎片化并且新架構(gòu)的發(fā)展導(dǎo)致更多的不可預(yù)測(cè)性。最終，基準(zhǔn)測(cè)試應(yīng)用程序提供了一種可信且更可靠的 TOPS 替代方案，而 AI 加速器支持更有效的評(píng)估。

審核編輯黃昊宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

加速器

加速器

+關(guān)注

關(guān)注
2

文章
796

瀏覽量
37838
AI

AI

+關(guān)注

關(guān)注
87

文章
30728

瀏覽量
268886

評(píng)論

相關(guān)推薦

從版本控制到全流程支持：揭秘Helix Core如何成為您的創(chuàng)意加速器

加速器

龍智DevSecOps

發(fā)布于 :2024年11月26日 13:42:47

IBM與AMD攜手部署MI300X加速器，強(qiáng)化AI與HPC能力

舉措預(yù)計(jì)將于2025年上半年正式推出。此次合作的核心目標(biāo)是提升通用人工智能(AI)模型的性能與能效，并為企業(yè)客戶(hù)提供高性能計(jì)算(HPC)應(yīng)用的強(qiáng)大支持。AMD的Instinct MI300X

發(fā)表于 11-21 11:07 ?210次閱讀

IBM將在云平臺(tái)部署AMD加速器

IBM與AMD近期宣布了一項(xiàng)重要合作協(xié)議，根據(jù)協(xié)議，IBM將在其云平臺(tái)上部署AMD Instinct MI300X加速器。這一舉措旨在提升企業(yè)客戶(hù)在生成式AI模型方面的性能和能效，進(jìn)一步推動(dòng)A

發(fā)表于 11-19 16:24 ?211次閱讀

樹(shù)莓派新推AI HAT+:26 TOPS高性能版本震撼登場(chǎng)

供了兩種性能配置供用戶(hù)選擇。其中，基礎(chǔ)版配備了Hailo-8L加速器，性能達(dá)到13 TOPS（每秒萬(wàn)億次操作），售價(jià)為70美元；而更為強(qiáng)大的高端版本則采用了Hailo-8

發(fā)表于 11-07 13:44 ?421次閱讀

最強(qiáng)服務(wù)器CPU來(lái)了！AI性能直接翻倍

以及AI服務(wù)器及AI數(shù)據(jù)中心場(chǎng)景的CPU產(chǎn)品。它不僅能支持廣泛的第三方GPU及AI加速器，與它們組合形成強(qiáng)大的異構(gòu)計(jì)算平臺(tái)，還能在其中補(bǔ)足G

發(fā)表于 09-29 11:00 ?723次閱讀

SiFive發(fā)布MX系列高性能AI加速器IP

在AI技術(shù)日新月異的今天，RISC-V IP設(shè)計(jì)領(lǐng)域的領(lǐng)軍企業(yè)SiFive再次引領(lǐng)行業(yè)潮流，正式推出了其革命性的SiFive Intelligence XM系列高性能AI加速器IP。這

發(fā)表于 09-24 14:46 ?346次閱讀

TDA4 Edge AI處理器的性能和效率基準(zhǔn)測(cè)試

電子發(fā)燒友網(wǎng)站提供《TDA4 Edge AI處理器的性能和效率基準(zhǔn)測(cè)試.pdf》資料免費(fèi)下載

發(fā)表于 09-11 09:21 ?0次下載

刷新AI PC NPU算力，AMD銳龍AI 9 HX 375領(lǐng)銜55 TOPS

電子發(fā)燒友網(wǎng)報(bào)道（文/黃晶晶）最近AMD官網(wǎng)上線了銳龍AI 300系列中的最新成員銳龍AI 9 HX 375處理器。原本Ryzen AI 9 HX 370的NPU達(dá)到了50

發(fā)表于 08-07 00:28 ?3329次閱讀

NPU和AI TOPS是什么？它們有哪些性能？

可運(yùn)行AI模型的性能、準(zhǔn)確性和效率。如今，TOPS(每秒萬(wàn)億次運(yùn)算)是衡量處理器AI性能的主要方

發(fā)表于 06-13 10:33 ?810次閱讀

Arm推動(dòng)生成式AI落地邊緣！全新Ethos-U85 AI加速器支持Transformer 架構(gòu)，性能提升四倍

滿(mǎn)足更高性能和更復(fù)雜的 AI 工作負(fù)載。Ethos-U NPU系列是業(yè)界首款 AI 微加速器，英飛凌、恩智浦半導(dǎo)體、奇景光電 (Himax)、Alif Semiconductor 和

發(fā)表于 04-16 09:10 ?4588次閱讀

Hitek Systems開(kāi)發(fā)基于PCIe的高性能加速器以滿(mǎn)足行業(yè)需求

Hitek Systems 使用開(kāi)放式 FPGA 堆棧 (OFS) 和 Agilex 7 FPGA，以開(kāi)發(fā)基于最新 PCIe 的高性能加速器 (HiPrAcc)，旨在滿(mǎn)足網(wǎng)絡(luò)、計(jì)算和高容量存儲(chǔ)應(yīng)用的需求。

發(fā)表于 03-22 14:02 ?623次閱讀

瑞薩發(fā)布下一代動(dòng)態(tài)可重構(gòu)人工智能處理器加速器

瑞薩最新發(fā)布的動(dòng)態(tài)可重構(gòu)人工智能處理器（DRP-AI）加速器，在業(yè)界引起了廣泛關(guān)注。這款加速器擁有卓越的10 TOPS/W高功率效率，相比傳

發(fā)表于 03-08 13:45 ?766次閱讀

瑞薩電子宣布推出一款面向高性能機(jī)器人應(yīng)用的新產(chǎn)品—RZ/V2H

具有10TOPS/W能效的新一代AI加速器無(wú)需冷卻風(fēng)扇即可提供高達(dá)80TOPS的AI推理性能

發(fā)表于 03-01 10:41 ?824次閱讀

家居智能化，推動(dòng)AI加速器的發(fā)展

電子發(fā)燒友網(wǎng)報(bào)道（文/黃山明）AI加速芯片，也稱(chēng)為人工智能加速器（AI Accelerator），是一種專(zhuān)為執(zhí)行機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)而設(shè)計(jì)的ASIC或定制化處理

發(fā)表于 02-23 00:18 ?4580次閱讀

回旋加速器原理回旋加速器的影響因素

回旋加速器（Cyclotron）是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子在恒定強(qiáng)磁場(chǎng)中的運(yùn)動(dòng)。本文將詳細(xì)介紹回旋加速器的原理以及影響因素。一、回旋

發(fā)表于 01-30 10:02 ?3924次閱讀