色婷婷.com,四虎影院永久免费,亚洲区色影

隨著人工智能的爆炸式增長，人們?cè)絹碓疥P(guān)注能夠提供人工智能所需性能的新型專業(yè)推理引擎。因此，在過去六個(gè)月中，我們看到了一系列神經(jīng)推理硬件公告，所有這些都承諾提供比市場上任何其他產(chǎn)品更好的加速。然而，挑戰(zhàn)在于沒有人真正知道如何衡量一個(gè)與另一個(gè)。這是一項(xiàng)新技術(shù)，就像任何新技術(shù)一樣，我們需要指標(biāo)，我們需要真正重要的指標(biāo)。

一切都與吞吐量有關(guān)

當(dāng)推理引擎的性能出現(xiàn)時(shí)，供應(yīng)商會(huì)拋出諸如 TOPS（Tera-Operations/Second）性能和 TOPS/Watt 之類的基準(zhǔn)。研究這些的系統(tǒng)/芯片設(shè)計(jì)人員很快意識(shí)到這些數(shù)字通常毫無意義。真正重要的是推理引擎可以為模型、圖像大小、批量大小和過程以及 PVT（過程/電壓/溫度）條件提供多少吞吐量。這是衡量其性能表現(xiàn)的第一個(gè)衡量標(biāo)準(zhǔn)，但令人驚訝的是，很少有供應(yīng)商提供它。

TOPS 的最大問題是，當(dāng)一家公司說他們的引擎執(zhí)行 X TOPS 時(shí)，他們通常會(huì)引用這一點(diǎn)而沒有說明條件是什么。在不知道這些信息的情況下，他們錯(cuò)誤地認(rèn)為 X TOPS 意味著它可以執(zhí)行 X 萬億次操作。實(shí)際上，報(bào)價(jià) 130 TOPS 的公司可能僅提供 27 TOPS 的可用吞吐量。

另一個(gè)正在使用但不太常用的基準(zhǔn)是 ResNet-50。這個(gè)基準(zhǔn)的問題是大多數(shù)引用它的公司都沒有給出批量大小。如果他們不這樣做，芯片設(shè)計(jì)人員可以假設(shè)這將是一個(gè)大批量，以最大限度地提高他們的硬件利用率。這使得 ResNet-50 作為基準(zhǔn)不是很有幫助。相比之下，例如 YOLOv3 需要 100 倍以上的操作來處理 2 兆像素的圖像。在“真實(shí)世界”模型中，硬件利用率將面臨更大挑戰(zhàn)。

如何正確測量神經(jīng)推理引擎

在評(píng)估神經(jīng)推理引擎時(shí)，需要注意幾個(gè)關(guān)鍵事項(xiàng)。以下是最重要的考慮因素以及它們?yōu)楹握嬲匾脑颉?/p>

定義什么是操作：一些供應(yīng)商將乘法（通常為 INT 8 乘以 INT 8）計(jì)為一次操作，將累加（加法，通常為 INT 32）計(jì)為一次操作。因此，一次乘法累加等于 2 次操作。但是，一些供應(yīng)商在其 TOPS 規(guī)范中包含其他類型的操作，因此必須在開始時(shí)進(jìn)行澄清。

詢問操作條件是什么：如果供應(yīng)商提供 TOPS 而不提供條件，他們通常使用室溫、標(biāo)稱電壓和典型工藝。通常他們會(huì)提到他們所指的工藝節(jié)點(diǎn)，但不同供應(yīng)商的運(yùn)行速度不同，大多數(shù)工藝提供2、3或更多的標(biāo)稱電壓。由于性能是頻率的函數(shù)，而頻率是電壓的函數(shù)，因此芯片設(shè)計(jì)人員在 0.9V 時(shí)可以獲得比在 0.6V 時(shí)高兩倍以上的性能。頻率因條件/假設(shè)而異。有關(guān)這方面的更多信息，請(qǐng)參閱此應(yīng)用說明。

看看批量大小：即使供應(yīng)商提供最壞情況的 TOPS，芯片設(shè)計(jì)人員也需要弄清楚所有這些操作是否真的有助于計(jì)算他們的神經(jīng)網(wǎng)絡(luò)模型。實(shí)際上，實(shí)際利用率可能非常低，因?yàn)闆]有推理引擎始終 100% 地使用所有 MAC。這就是批量大小很重要的原因。批處理是為給定層加載權(quán)重并同時(shí)處理多個(gè)數(shù)據(jù)集。這樣做的原因是為了提高吞吐量，但放棄的是更長的延遲。ResNet-50 擁有超過 2000 萬個(gè)權(quán)重；YOLOv3 擁有超過 6000 萬個(gè)權(quán)重；并且必須為每個(gè)圖像獲取每個(gè)權(quán)重并將其加載到 MAC 結(jié)構(gòu)中。權(quán)重太多，無法讓它們都駐留在 MAC 結(jié)構(gòu)中。

找出你的 MAC 利用率：并非所有神經(jīng)網(wǎng)絡(luò)的行為都相同。您需要以您需要的批量大小找出您想要部署的神經(jīng)網(wǎng)絡(luò)模型的神經(jīng)推理引擎的實(shí)際 MAC 利用率。

深入TOPS

如果您是一名正在研究神經(jīng)推理引擎的設(shè)計(jì)師，希望這篇文章能夠闡明要尋找的內(nèi)容。請(qǐng)記住——重要的是吞吐量。重要的是不要陷入諸如 TOPS 和 ResNet-50 之類的毫無意義的基準(zhǔn)測試中，除非您知道圍繞這些問題要問的問題。首先提出以下問題：在批量大小 = A 和 XYZ PVT 條件下，可以為特定模型（例如 YOLOv3）處理多少圖像/秒。一旦您開始指定條件和假設(shè)，您將開始了解任何神經(jīng)推理在現(xiàn)實(shí)世界中的表現(xiàn)如何。歸根結(jié)底，這才是最重要的。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

芯片

芯片

+關(guān)注

關(guān)注
456

文章
50936

瀏覽量
424677
神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4773

瀏覽量
100890
人工智能

人工智能

+關(guān)注

關(guān)注
1792

文章
47409

瀏覽量
238924

評(píng)論

相關(guān)推薦

選用哪款條碼掃描引擎嵌入手持終端類使用？尺寸小巧讀取率高？

引擎為何能在眾多產(chǎn)品中脫穎而出，成為嵌入手持終端的理想選擇。LV30條碼掃描引擎以其緊湊的設(shè)計(jì)著稱，這一特性使得它能夠輕松融入各種尺寸的手持終端中

發(fā)表于 01-06 15:19 ?51次閱讀

喜報(bào)！全國首批！賽思成功獲選國家級(jí)專精特新重點(diǎn)“小巨人”企業(yè)！

萬里挑一！賽思從16000多家專精特新“小巨人”企業(yè)中脫穎而出，榮獲國家級(jí)專精特新“重點(diǎn)小巨人企業(yè)。

發(fā)表于 12-05 11:46 ?350次閱讀

重磅！賽思榮膺投資家網(wǎng)“2024年度最具投資價(jià)值企業(yè)TOP100”！

入選率僅2%！賽思憑借在時(shí)鐘同步及混合數(shù)模領(lǐng)域的卓絕表現(xiàn)，從4600余家企業(yè)中脫穎而出！

發(fā)表于 12-03 18:52 ?223次閱讀

尼爾森數(shù)據(jù)背后：Shokz韶音如何在全球運(yùn)動(dòng)耳機(jī)市場脫穎而出

全球市場調(diào)研機(jī)構(gòu)尼爾森，近日在巴黎馬拉松期間發(fā)布了Sport2024調(diào)研報(bào)告。數(shù)據(jù)表明，68%的消費(fèi)者在跑步時(shí)有聽音樂的習(xí)慣，而在消費(fèi)者跑步時(shí)最常佩戴的耳機(jī)品牌中，蘋果、韶音等榜上有名。其中，定位

發(fā)表于 11-18 14:53 ?284次閱讀

李開復(fù):中國擅長打造經(jīng)濟(jì)實(shí)惠的AI推理引擎

10月22日上午，零一萬物公司的創(chuàng)始人兼首席執(zhí)行官李開復(fù)在與外媒的交流中透露，其公司旗下的Yi-Lightning（閃電模型）在推理成本上已實(shí)現(xiàn)了顯著優(yōu)勢，比OpenAI的GPT-4o模型低了31倍。他強(qiáng)調(diào)，中國擅長打造經(jīng)濟(jì)實(shí)惠的AI推

發(fā)表于 10-22 16:54 ?372次閱讀

國產(chǎn)MCU廠商，靠什么從內(nèi)卷中脫穎而出？

導(dǎo)語在當(dāng)下內(nèi)卷的大環(huán)境下，航順芯片是如何消除內(nèi)卷，突破高端的？當(dāng)前，全球半導(dǎo)體行業(yè)正經(jīng)歷寒冬。受經(jīng)濟(jì)環(huán)境疲軟、消費(fèi)需求減弱、庫存調(diào)整等因素影響，半導(dǎo)體市場增速顯著放緩。在這種背景下，半導(dǎo)體廠商間的競爭日益激烈，價(jià)格戰(zhàn)已成常態(tài)，MCU市場亦不例外。SIA數(shù)據(jù)顯示，中國MCU市場占全球25%左右。盡管市場規(guī)模龐大，但國內(nèi)MCU廠商的產(chǎn)品主要集中在中低端市場，同質(zhì)

發(fā)表于 10-22 16:20 ?346次閱讀

澎峰科技高性能大模型推理引擎PerfXLM解析

模型的高性能推理框架，并受到廣泛關(guān)注。在歷經(jīng)數(shù)月的迭代開發(fā)后，澎峰科技重磅發(fā)布升級(jí)版本，推出全新的高性能大模型推理引擎：PerfXLM。

發(fā)表于 09-29 10:14 ?500次閱讀

如何在華東電機(jī)控制器市場脫穎而出?

華東電機(jī)控制器市場的創(chuàng)新方向，文中參考答案都有了。前言：隨著工業(yè)自動(dòng)化和智能化進(jìn)程的加速推進(jìn)，電機(jī)控制器作為驅(qū)動(dòng)系統(tǒng)的核心部件，在推動(dòng)產(chǎn)業(yè)升級(jí)轉(zhuǎn)型中扮演著至關(guān)重要的角色。華東電機(jī)控制器市場以其

發(fā)表于 08-05 10:59 ?220次閱讀

NAS設(shè)備鐵威馬F4-424是如何從市場中脫穎而出的

簡便又性能卓越的家用NAS，成為了眾多家庭面臨的難題。今天，我們將聚焦于鐵威馬F4-424這款NAS設(shè)備，探討它是如何憑借其出色的性能與易用性，在家用NAS市場中脫穎而出，成為家庭用戶的理想之選。

發(fā)表于 07-18 17:28 ?791次閱讀

深度學(xué)習(xí)編譯器和推理引擎的區(qū)別

深度學(xué)習(xí)編譯器和推理引擎在人工智能領(lǐng)域中都扮演著至關(guān)重要的角色，但它們各自的功能、應(yīng)用場景以及優(yōu)化目標(biāo)等方面存在顯著的差異。以下是對(duì)兩者區(qū)別的詳細(xì)探討。

發(fā)表于 07-17 18:12 ?1282次閱讀

運(yùn)動(dòng)相機(jī)為什么會(huì)脫穎而出

? 01 運(yùn)動(dòng)相機(jī)為什么會(huì)脫穎而出 與傳統(tǒng)相機(jī)或手機(jī)拍攝相比，運(yùn)動(dòng)相機(jī)具備防水和耐沖擊的特性，適合在戶外活動(dòng)中使用。運(yùn)動(dòng)相機(jī)通常具有的廣角鏡頭、高分辨率和高幀率的功能，可以拍攝的范圍更廣，畫面也更

發(fā)表于 06-27 16:01 ?679次閱讀

新一代驅(qū)動(dòng)器產(chǎn)品，PI SCALE-iFlex? XLT如何脫穎而出？

即插即用！作為新一代驅(qū)動(dòng)器產(chǎn)品，看SCALE-iFlex? XLT如何以其獨(dú)特的設(shè)計(jì)和出色的性能，在市場中脫穎而出！在電力電子領(lǐng)域，高效、緊湊且安全的門極驅(qū)動(dòng)器產(chǎn)品設(shè)計(jì)一直是研發(fā)的焦點(diǎn)。隨著儲(chǔ)能

發(fā)表于 05-27 14:55 ?327次閱讀

慧視圖像處理板究竟憑什么脫穎而出？

市面上的圖像處理板有很多，如何通過分析獲得自己滿意的產(chǎn)品，從而減少自身項(xiàng)目的開發(fā)時(shí)間，是一個(gè)重要的過程。如果你有圖像處理板的需要，那么這篇短文你應(yīng)該往下看一看！經(jīng)驗(yàn)豐富成都慧視光電多年來一直致力于圖像處理板的開發(fā)應(yīng)用，有著超十年開發(fā)經(jīng)驗(yàn)的團(tuán)隊(duì)成員，能夠快速進(jìn)行軟硬件的模塊化集成，定制出符合行業(yè)需求的圖像處理板。曾服務(wù)過安防巡檢、鐵路、空港、高校研究院、事業(yè)研

發(fā)表于 04-30 08:29 ?466次閱讀

大模型推理顯卡選購指南：4090顯卡為何成為不二之選

開發(fā)者非常關(guān)注的話題。現(xiàn)在市面上加速卡型號(hào)多如牛毛,但說到適用大模型推理的顯卡,那4090顯卡絕對(duì)是現(xiàn)階段“推理王卡”般的存在。論性能不如H100,論價(jià)格不如3090,看似平平無奇的4090顯卡為何能在眾多競爭者中

發(fā)表于 04-11 11:00 ?791次閱讀

解鎖AI時(shí)代的利器——訊飛AI鼠標(biāo)AM30助你在AI時(shí)代脫穎

飛AI鼠標(biāo)AM30就是你在AI時(shí)代的利器，它憑借其出色的功能和特點(diǎn)，助你在激烈的競爭中脫穎而出。訊飛AI鼠標(biāo)AM30搭載了星火認(rèn)知大模型AI，為你提供了多種強(qiáng)大的功能。 PPT制作、問答、寫作還是繪畫，AI都能幫你輕松搞定。你只需要輸入相關(guān)指令，AI就會(huì)立即

發(fā)表于 03-25 13:37 ?576次閱讀