色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MLPerf:邊緣AI推理的新行業(yè)基準

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:嵌入式計算設(shè)計 ? 2022-10-14 09:41 ? 次閱讀

這些數(shù)字重要嗎?它們中的大多數(shù)都是在實驗室類型的環(huán)境中生產(chǎn)的,其中理想的條件和工作負載允許被測設(shè)備(SUT)產(chǎn)生用于營銷目的的最高分數(shù)。另一方面,大多數(shù)工程師可能不太關(guān)心這些理論可能性。他們更關(guān)心的是技術(shù)如何影響其推理設(shè)備的準確性、吞吐量和/或延遲。

將計算元素與特定工作負載進行比較的行業(yè)標準基準測試更有用。例如,圖像分類工程師可以確定滿足其性能要求的多個選項,然后根據(jù)功耗、成本等對其進行縮減。語音識別設(shè)計人員可以使用基準測試結(jié)果來分析各種處理器和內(nèi)存組合,然后決定是在本地還是在云中合成語音。

但是,AI和ML模型,開發(fā)框架和工具的快速引入使這種比較復(fù)雜化。如圖 1 所示,AI 技術(shù)堆棧中越來越多的選項也意味著可用于判斷推理性能的排列呈指數(shù)級增長。這是在考慮模型和算法可以針對給定系統(tǒng)架構(gòu)進行優(yōu)化的所有方法之前。

pYYBAGNIvmeAfv_HAAHbWQS6EGk129.png

圖 1.AI開發(fā)堆棧中越來越多的選項使行業(yè)標準基準測試變得復(fù)雜。

毋庸置疑,制定這樣一個全面的基準超出了大多數(shù)公司的能力或愿望。即使有人能夠完成這一壯舉,工程界真的會接受它作為“標準基準”嗎?

機器學習成果:人工智能推理的更好基準

更廣泛地說,在過去幾年中,工業(yè)界和學術(shù)界已經(jīng)開發(fā)了幾個推理基準,但他們傾向于關(guān)注新興人工智能市場的更多利基領(lǐng)域。一些例子包括EEMBC用于嵌入式圖像分類和對象檢測的MLMark,蘇黎世聯(lián)邦理工學院的AI基準測試,針對Android智能手機上的計算機視覺,以及哈佛的Fathom基準測試,強調(diào)各種神經(jīng)網(wǎng)絡(luò)的吞吐量,但不是準確性。

對 AI 推理格局的更完整評估可以在 MLPerf 最近發(fā)布的推理 v0.5 基準測試中找到。MLPerf 推理是社區(qū)開發(fā)的測試套件,可用于測量 AI 硬件、軟件、系統(tǒng)和服務(wù)的推理性能。這是來自30多家公司的200多名工程師合作的結(jié)果。

正如您對任何基準測試所期望的那樣,MLPerf 推理定義了一套標準化工作負載,這些工作負載被組織成圖像分類、對象檢測和機器翻譯用例的“任務(wù)”。每個任務(wù)都由與正在執(zhí)行的功能相關(guān)的 AI 模型和數(shù)據(jù)集組成,其中圖像分類任務(wù)支持 ResNet-50 和 MobileNet-v1 模型,對象檢測任務(wù)利用具有 ResNet34 或 MobileNet-v1 主干的 SSD 模型,以及使用 GNMT 模型的機器轉(zhuǎn)換任務(wù)。

除了這些任務(wù)之外,MLPerf 推理開始偏離傳統(tǒng)基準測試的規(guī)范。由于準確性、延遲、吞吐量和成本的重要性在不同用例中具有不同的權(quán)重,因此 MLPerf 推理通過在移動設(shè)備、自動駕駛汽車、機器人和云這四個關(guān)鍵應(yīng)用領(lǐng)域中根據(jù)質(zhì)量目標對推理性能進行分級來權(quán)衡。

為了在盡可能接近在這些應(yīng)用領(lǐng)域中運行的真實系統(tǒng)的上下文中有效地對任務(wù)進行分級,MLPerf 推理引入了一個負載生成器工具,該工具根據(jù)四種不同的方案生成查詢流量:

樣本大小為 1 的連續(xù)單流查詢,在移動設(shè)備中很常見

連續(xù)的多流查詢,每個流有多個樣本,就像在延遲至關(guān)重要的自動駕駛汽車中發(fā)現(xiàn)的那樣

請求隨機到達的服務(wù)器查詢,例如在延遲也很重要的 Web 服務(wù)中

執(zhí)行批處理且吞吐量是一個突出考慮因素的脫機查詢

負載生成器在測試準確性和吞吐量(性能)的模式下提供這些方案。圖 2 描述了 SUT 如何從負載生成器接收請求,相應(yīng)地將數(shù)據(jù)集中的樣本加載到內(nèi)存中,運行基準測試并將結(jié)果返回到負載生成器。然后,準確性腳本將驗證結(jié)果。

pYYBAGNIvnCAEAcaAAENd-3ADao787.png

圖 2. MLPerf 推理基準測試依賴于負載生成器,該負載生成器根據(jù)許多實際方案查詢被測系統(tǒng) (SUT)。

作為基準測試的一部分,每個 SUT 必須執(zhí)行最少數(shù)量的查詢,以確保統(tǒng)計置信度。

提高靈活性

如前所述,人工智能技術(shù)市場中使用的各種框架和工具是任何推理基準測試的關(guān)鍵挑戰(zhàn)。前面提到的另一個考慮因素是調(diào)整模型和算法,以從AI推理系統(tǒng)中擠出最高的準確性,吞吐量或最低延遲。就后者而言,量化和圖像重塑等技術(shù)現(xiàn)在是常見的做法。

MLPerf 推理是一種語義級基準測試,這意味著,雖然基準測試提供了特定的工作負載(或一組工作負載)以及執(zhí)行它的一般規(guī)則,但實際實現(xiàn)取決于執(zhí)行基準測試的公司。公司可以優(yōu)化提供的參考模型,使用他們想要的工具鏈,并在他們選擇的硬件目標上運行基準測試,只要它們保持在特定的指導(dǎo)方針之內(nèi)。

但是,重要的是要注意,這并不意味著提交公司可以對MLPerf模型或數(shù)據(jù)集采取任何和所有自由,并且仍然有資格獲得主要基準。MLPerf 推理基準分為兩個部分 - 封閉式和開放式 - 封閉式部門對可以使用哪些類型的優(yōu)化技術(shù)以及其他禁止的優(yōu)化技術(shù)有更嚴格的要求。

要獲得封閉分區(qū)的資格,提交者必須使用提供的模型和數(shù)據(jù)集,但允許量化。為了確保兼容性,封閉部門的參賽者不能使用重新訓(xùn)練或修剪的模型,也不能使用緩存或已調(diào)整為基準或數(shù)據(jù)集感知的網(wǎng)絡(luò)。

另一方面,開放式劃分旨在促進AI模型和算法的創(chuàng)新。仍需要向開放分區(qū)提交以執(zhí)行相同的任務(wù),但可以更改模型類型、重新訓(xùn)練和修剪其模型、使用緩存等。

盡管封閉式劃分可能聽起來很嚴格,但超過 150 個條目成功獲得了 MLPerf 推理 v0.5 發(fā)布資格。圖3和圖4展示了參賽者使用的AI技術(shù)堆棧的多樣性,這些堆棧幾乎涵蓋了從ONNX和PyTorch到TensorFlow,OpenVINO和Arm NN的各種處理器架構(gòu)和軟件框架。

poYBAGNIvneATVpSAAD0vbiiLaI086.png

圖 3.數(shù)字信號處理器、FPGACPU、ASICGPU 都成功完成了 MLPerf 推理封閉式除法要求。

pYYBAGNIvn-ALKBBAAFGgFHFxJs564.png

圖 4. 人工智能軟件開發(fā)框架,如 ONNX、畢拓、張量流、OpenVINO、Arm NN 等,被用于開發(fā)符合封閉分區(qū)基準測試的 MLPerf 推理系統(tǒng)。

消除評估中的猜測

雖然 MLPerf 推理的初始版本包含一組有限的模型和用例,但基準測試套件是以模塊化、可擴展的方式構(gòu)建的。這將使MLPerf能夠隨著技術(shù)和行業(yè)的發(fā)展而擴展任務(wù),模型和應(yīng)用領(lǐng)域,并且組織已經(jīng)計劃這樣做。

最新的AI推理基準顯然是目前可用的最接近真實世界AI推理性能的衡量標準。但隨著它的成熟并吸引更多的提交,它也將成為成功部署的技術(shù)堆棧的晴雨表,以及新實施的試驗場。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19312

    瀏覽量

    230034
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30996

    瀏覽量

    269288
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47350

    瀏覽量

    238753
收藏 人收藏

    評論

    相關(guān)推薦

    漢威科技集團推出Ai200邊緣計算網(wǎng)關(guān),引領(lǐng)智慧監(jiān)測新潮流

    推理邊緣計算能力于一身,能夠高效處理和分析來自各類傳感器的數(shù)據(jù),為用戶提供實時、準確的監(jiān)測信息。這款網(wǎng)關(guān)不僅具備強大的數(shù)據(jù)處理能力,還具備高度的靈活性和可擴展性,能夠輕松適應(yīng)不同行業(yè)的特定需求。 目前,
    的頭像 發(fā)表于 01-03 14:09 ?144次閱讀

    MLCommons推出AI基準測試0.5版

    開放式機器學習工程聯(lián)盟 MLCommons 在美國加州當?shù)貢r間公布推出適用于消費類 PC 的 AI 性能的 MLPerf Client 基準測試的 0.5 版,這是該測試的第一個公開版本
    的頭像 發(fā)表于 12-12 16:47 ?327次閱讀

    浪潮信息AS13000G7榮獲MLPerf? AI存儲基準測試五項性能全球第一

    北京2024年9月27日?/美通社/ -- 9月25日,MLCommons協(xié)會發(fā)布最新MLPerf? Storage v1.0 AI存儲基準測試成績。浪潮信息分布式存儲平臺AS13000G7表現(xiàn)出
    的頭像 發(fā)表于 09-28 16:46 ?221次閱讀
    浪潮信息AS13000G7榮獲<b class='flag-5'>MLPerf</b>? <b class='flag-5'>AI</b>存儲<b class='flag-5'>基準</b>測試五項性能全球第一

    什么是邊緣AI?邊緣AI的供電挑戰(zhàn)

    RECOM 的 RACM1200-V 采用數(shù)字通信,可輕松集成到邊緣 AI設(shè)計中。
    的頭像 發(fā)表于 09-02 11:52 ?488次閱讀
    什么是<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>?<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>的供電挑戰(zhàn)

    智能邊緣放大招!英特爾舉辦2024網(wǎng)絡(luò)與邊緣計算行業(yè)大會,邊緣AI創(chuàng)新助力多元化應(yīng)用

    今日,第十七屆英特爾網(wǎng)絡(luò)與邊緣計算行業(yè)大會在天津舉行,超過400位生態(tài)伙伴和客戶代表齊聚一堂,與英特爾共同探討邊緣AI的未來發(fā)展趨勢,并介紹了眾多基于英特爾
    的頭像 發(fā)表于 07-25 09:10 ?3008次閱讀
    智能<b class='flag-5'>邊緣</b>放大招!英特爾舉辦2024網(wǎng)絡(luò)與<b class='flag-5'>邊緣</b>計算<b class='flag-5'>行業(yè)</b>大會,<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>創(chuàng)新助力多元化應(yīng)用

    如何基于OrangePi?AIpro開發(fā)AI推理應(yīng)用

    香橙派AIpro開發(fā)板采用昇騰AI技術(shù)路線,接口豐富且具有強大的可擴展性,提供8/20TOPS澎湃算力,可廣泛使用于AI邊緣計算、深度視覺學習及視頻流AI分析、視頻圖像分析、自然語言處
    的頭像 發(fā)表于 06-04 14:23 ?544次閱讀
    如何基于OrangePi?AIpro開發(fā)<b class='flag-5'>AI</b><b class='flag-5'>推理</b>應(yīng)用

    ai邊緣盒子有哪些用途?ai視頻分析邊緣計算盒子詳解

    近年來,隨著人工智能和邊緣計算的發(fā)展,一種名為AI邊緣盒子的新型設(shè)備正逐漸引起廣泛關(guān)注。作為一種集成了邊緣計算和AI算法處理能力的設(shè)備,
    的頭像 發(fā)表于 05-29 14:24 ?1000次閱讀
    <b class='flag-5'>ai</b><b class='flag-5'>邊緣</b>盒子有哪些用途?<b class='flag-5'>ai</b>視頻分析<b class='flag-5'>邊緣</b>計算盒子詳解

    邊緣側(cè)AI芯片提供商超星未來完成數(shù)億元 Pre-B輪融資

    AI產(chǎn)業(yè)生態(tài)中,計算芯片被視為行業(yè)的“賣水人”。依據(jù)云端/邊緣端、訓(xùn)練/推理兩大分類標準,AI芯片可劃分為四個類別,其中
    的頭像 發(fā)表于 05-09 09:38 ?573次閱讀

    除英偉達Jetson系列外,AI邊緣計算盒子還能搭載哪些算力芯片

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)過去幾年,隨著英偉達推出Jetson系列開始,搭載各種AI算力芯片的邊緣設(shè)備相繼問世。因為外觀形似盒子,具備算法推理能力,為區(qū)分一般傳統(tǒng)工控機,行業(yè)多稱之
    的頭像 發(fā)表于 05-06 09:21 ?4174次閱讀

    開發(fā)者手機 AI - 目標識別 demo

    識別demo: JS實現(xiàn)UI界面的功能; Native接口及實現(xiàn)主要為JS提供接口進行AI推理。通過Native方式完成推理的前處理、推理以及后處理,這里通過調(diào)用opencv、Mind
    發(fā)表于 04-11 16:14

    UL Procyon AI 發(fā)布圖像生成基準測試,基于Stable Diffusion

    UL去年發(fā)布的首個Windows版Procyon AI推理基準測試,以計算機視覺工作負載評估AI推理性能。新推出的圖像生成測試將提供統(tǒng)一、精
    的頭像 發(fā)表于 03-25 16:16 ?895次閱讀

    深度探討VLMs距離視覺演繹推理還有多遠?

    通用大型語言模型(LLM)推理基準:研究者們介紹了多種基于文本的推理任務(wù)和基準,用于評估LLMs在不同領(lǐng)域(如常識、數(shù)學推理、常識
    發(fā)表于 03-19 14:32 ?367次閱讀
    深度探討VLMs距離視覺演繹<b class='flag-5'>推理</b>還有多遠?

    基于EdgeX+OpenVINO?的邊緣智能融合網(wǎng)關(guān)YiFUSION實戰(zhàn)

    邊緣智能需求的大部分客戶已經(jīng)對AI推理邊緣計算有一定的了解,都希望可以將邊緣數(shù)采和AI
    的頭像 發(fā)表于 02-29 18:18 ?1262次閱讀
    基于EdgeX+OpenVINO?的<b class='flag-5'>邊緣</b>智能融合網(wǎng)關(guān)YiFUSION實戰(zhàn)

    什么是AI邊緣計算,AI邊緣計算的特點和優(yōu)勢介紹

    隨著人工智能的迅猛發(fā)展,AI邊緣計算成為了熱門話題。那么什么是AI邊緣計算呢?簡單來說,它是將人工智能技術(shù)引入邊緣計算的新興領(lǐng)域,旨在將計算
    的頭像 發(fā)表于 02-01 11:42 ?905次閱讀

    邊緣AI它到底是什么?能做什么?

    邊緣,減少了數(shù)據(jù)的傳輸延遲和依賴云端的通信需求。邊緣AI能夠在接近數(shù)據(jù)源的設(shè)備上進行實時決策和推理,這為許多應(yīng)用領(lǐng)域帶來了革命性的改變。 邊緣
    的頭像 發(fā)表于 01-11 14:44 ?1322次閱讀
    主站蜘蛛池模板: 折磨比基尼美女挠肚子| 亚洲中文在线精品国产| 久久看片网| 国产在线高清视频无码不卡| 囯产精品久久久久免费蜜桃| WWW国产精品内射老师| 99久久久精品免费观看国产| 91免费精品国自产拍在线可以看| 在线黑人抽搐潮喷| 在线免费观看成年人视频| 一一本之道高清视频在线观看中文字幕| 亚洲精品久久久久AV无码| 亚洲精品动漫免费二区| 亚洲免费黄色片| 一个人免费观看在线视频播放| 亚洲无码小格式| 夜夜骑夜夜欢| 2017日日干| xxxx69日本| 抽插H浊水H嫩B父皇| 贵妇局长的蕾丝乳罩| 国产精品1卡二卡三卡四卡乱码| 国产成人一区二区三中文| 国产精品大全国产精品| 国产特级毛片AAAAAAA高清| 国模大胆一区二区三区| 久久re6热在线视频精品| 伦理片秋霞免费影院| 欧美老少欢杂交另类| 日本午夜精品久久久无码| 色婷婷综合久久久中文字幕 | 日本无码欧美激情在线视频| 色欲久久精品AV无码| 小夫妻天天恶战| 亚洲无人区码二码三码区别图| 在线综合 亚洲 欧美| beeg日本高清xxxx| 国产国产成人人免费影院| 极品内射少妇精品无码视频| 老牛天天晚上夜噜噜噜| 日本无码人妻精品一区二区视频|