色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用MLPerf 推理 1.1提升NVIDIA績效領導力

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-08 16:03 ? 次閱讀

人工智能繼續推動跨行業的突破性創新,包括消費互聯網、醫療保健和生命科學、金融服務、零售、制造和超級計算。研究人員繼續推動快速發展的模型在規模、復雜度和多樣性方面的發展。此外,其中許多復雜的大規模模型需要為聊天機器人、數字助理和欺詐檢測等人工智能支持的服務提供實時結果。

考慮到人工智能推理的廣泛用途,評估性能對開發人員和基礎設施管理人員提出了許多挑戰。對于數據中心、 edge 和移動平臺上的 AI 推理, MLPerf 推理 1.1 是一個行業標準基準,用于衡量計算機視覺醫學成像、自然語言和推薦系統的性能。這些基準由人工智能行業領導者組成的聯盟制定,為人工智能培訓和推理提供了當今最全面的同行評審績效數據集。

要在這一基準測試中完成大量測試,需要一個具有強大生態系統支持的全堆棧平臺,無論是框架還是網絡。 NVIDIA 是唯一一家提交所有數據中心和邊緣測試并提供全面領先性能的公司

這項工作的一個重要副產品是,這些優化中的許多已經進入了推理開發工具,如TensorRT和 NVIDIA Triton 。用于高性能深度學習推理的 TensorRT SDK 包括一個深度學習推理優化器和運行時,為深度學習推理應用程序提供低延遲和高吞吐量。

Triton 推理服務器軟件簡化了人工智能模型在大規模生產中的部署。這種開源推理服務軟件使團隊能夠在任何基于 GPUCPU 的基礎設施上從本地存儲或云平臺的任何框架部署經過培訓的人工智能模型。

按數字

在數據中心和邊緣兩大類中, NVIDIA 憑借 NVIDIA A100 張量核 GPU 和 NVIDIA A30 張量核 GPU 在性能測試中名列榜首。自從 MLPerf 推斷 0.7 的結果發布以來,在過去一年中, NVIDIA 僅通過軟件改進就提高了 50% 的性能。

在另一個行業中, NVIDIA 首次使用基于 GPU – 加速 ARM 的服務器提交數據中心類別,該服務器支持所有工作負載,并提供與類似配置的基于 x86 的服務器相同的結果。這些基于 ARM 的新提交為 GPU 加速 ARM 服務器創造了新的性能世界記錄。這標志著這些平臺的一個重要里程碑,因為它們現在已經在同行評審的行業標準基準中證明了自己,以提供市場領先的性能。它還展示了 NVIDIA ARM 軟件生態系統的性能、多功能性和就緒性,以應對數據中心的計算挑戰。

pYYBAGJP7FSAb4UmAABG9iwx2cg552.png

圖 1 。使用 Ampere Altra CPU s 的基于 ARM 的服務器提供的性能與類似配置的基于 x86 的服務器相當

MLPerf v1.1 推理關閉;每個加速器的性能源自使用數據中心脫機中報告的加速器計數的各個提交的最佳 MLPerf 結果。 x86 服務器: 1.1-034 、 ARM 服務器: 1.1-033 MLPerf 名稱和徽標是商標。

綜觀整體表現, NVIDIA 全面領先。圖 2 顯示了服務器場景的結果,其中使用泊松分布為測試中的系統生成推理工作,以更緊密地模擬真實世界的工作負載模式。

pYYBAGJP7FuAQr9CAACxiiMT8EI989.png

圖 2 。 NVIDIA 與 CPU 純服務器的性能比較

MLPerf v1.1 推理關閉;使用數據中心脫機和服務器中報告的加速器計數,從各個提交的最佳 MLPerf 結果中得出每個加速器的性能。高通 AI 100 : 1.1-057 和 1.1-058 ,英特爾至強 8380 : 1.1-023 和 1.1-024 , NVIDIA A30 : 1.1-43 , NVIDIA A100 ( ARM ): 1.1-033 , NVIDIA A100 ( x86 ): 1.1-047 。 MLPerf 名稱和徽標是商標。

NVIDIA 比 CPU 純服務器的性能全面提高了 104 倍。這種性能優勢轉化為對更大、更復雜的模型以及在對話 AI 、推薦系統和數字助理中實時作業中運行的多個模型進行推理的能力。

結果背后的優化

我們的工程團隊實施了一些優化,使這些偉大的結果成為可能。首先,基于 ARM 的服務器和基于 x86 的服務器的所有這些結果都是使用 TensorRT 8 生成的,現在普遍可用。特別令人感興趣的是雙內核的非冪函數的使用,這是為了加速工作負載而實現的,比如 BERT – 大型單流場景測試。

NVIDIA 提交利用添加到 NVIDIA Triton 推理服務器的新主機策略功能。您可以在配置 NVIDIA Triton 服務器時指定主機策略,以在服務器應用程序中啟用線程和內存固定。利用此功能, NVIDIA Triton 可以為系統中的每個 GPU 指定輸入的最佳位置。最佳位置可以基于系統的非統一內存體系結構( NUMA )配置,在這種情況下,每個 NUMA 節點上都有一個查詢樣本庫。

您還可以使用主機策略啟用“從設備啟動”配置設置,服務器將在選擇執行的 GPU 上拾取輸入。此設置還可以將網絡輸入直接輸入 GPU 內存,完全繞過 CPU 和系統內存副本。

推理能力三人組: TensorRT , NVIDIA Triton 和 NGC

NVIDIA 推理領導力來自于構建最優秀的人工智能加速器,用于培訓和推理。但同樣重要的是支持所有 AI 框架和 800 多個 HPC 應用程序的 NVIDIA 端到端、全棧軟件生態系統。

所有這些軟件都可以在NGC、 NVIDIA 集線器上獲得,該集線器帶有 GPU ——用于深度學習、機器學習和 HPC 的優化軟件。 NGC 負責所有管道,因此數據科學家、開發人員和研究人員可以專注于構建解決方案、收集 i NSight 并提供業務價值。

NGC 可通過您首選的云提供商的市場免費獲得。在那里,您可以找到 TensorRT 和 NVIDIA Triton 的最新版本,這兩個版本都有助于生成最新的 MLPerf 推斷 1.1 結果。

關于作者

Dave Salvator 是 NVIDIA 旗下 Tesla 集團的高級產品營銷經理,專注于超規模、深度學習和推理。

Jesus Corbal San Adrian 是 NVIDIA 計算架構組的杰出工程師,專注于深度學習推理 GPU 分析和優化。

Madhumitha Sridhara 是 TensorRT 團隊的高級軟件工程師,專注于使用 Triton 推理服務器的 NVIDIA MLPerf推理提交。她擁有卡內基梅隆大學計算機工程碩士學位和印度卡納塔克邦蘇拉特卡爾國家理工學院電子通信工程學士學位。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1791

    文章

    47350

    瀏覽量

    238753
  • 機器學習
    +關注

    關注

    66

    文章

    8422

    瀏覽量

    132714
  • 深度學習
    +關注

    關注

    73

    文章

    5504

    瀏覽量

    121222
  • MLPerf
    +關注

    關注

    0

    文章

    35

    瀏覽量

    645
收藏 人收藏

    評論

    相關推薦

    借助NVIDIA GPU提升魯班系統CAE軟件計算效率

    本案例中魯班系統高性能 CAE 軟件利用 NVIDIA 高性能 GPU,實現復雜產品的快速仿真,加速產品開發和設計迭代,縮短開發周期,提升產品競爭
    的頭像 發表于 12-27 16:24 ?135次閱讀

    納芯微電子榮獲“戰略性人才發展與領導力培育卓越獎”

    人力資源優秀案例征集活動人氣賽道的獲獎名單。 經過專業評審的嚴格篩選, 納芯微憑借在戰略性人才與領導力培養方面的杰出表現,榮獲了“戰略性人才發展與領導力培育卓越獎” 。 而這也是納芯微第二年在該活動中斬獲獎項, 去年我們榮
    的頭像 發表于 12-16 09:13 ?319次閱讀
    納芯微電子榮獲“戰略性人才發展與<b class='flag-5'>領導力</b>培育卓越獎”

    NVIDIA助力麗蟾科技打造AI訓練與推理加速解決方案

    麗蟾科技通過 Leaper 資源管理平臺集成 NVIDIA AI Enterprise,為企業和科研機構提供了一套高效、靈活的 AI 訓練與推理加速解決方案。無論是在復雜的 AI 開發任務中,還是在高并發推理場景下,都能夠確保項
    的頭像 發表于 10-27 10:03 ?224次閱讀
    <b class='flag-5'>NVIDIA</b>助力麗蟾科技打造AI訓練與<b class='flag-5'>推理</b>加速解決方案

    如何利用海外動態IP提升全球市場觸達

    利用海外動態IP提升全球市場觸達,是一個涉及多個方面的策略。
    的頭像 發表于 09-27 08:36 ?294次閱讀

    魔搭社區借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區是中國最具影響的模型開源社區,致力給開發者提供模型即服務的體驗。魔搭社區利用NVIDIA TensorRT-LLM,大大提高了大語言模型的推理性能,方便了模型應用部署,提高
    的頭像 發表于 08-23 15:48 ?459次閱讀

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務,與同樣剛推出的 Llama 3.1 系列開源模型一起,為全球企業的生成式 AI
    的頭像 發表于 07-25 09:48 ?716次閱讀

    博聯智能榮獲“2024全屋智能領導力品牌”獎

    近日,第八屆葵花獎智能家居評選頒獎盛典在中國建博會(廣州)廣交會展館圓滿落幕,BroadLink博聯智能憑借卓越的技術創新力和品牌榮獲“2024全屋智能領導力品牌”獎!
    的頭像 發表于 07-19 17:34 ?1050次閱讀

    DigiKey 在 2024 EDS 領導力峰會上斬獲供應商授予的多個最高獎項

    全球供應品類豐富、發貨快速的商業現貨技術元件和自動化產品分銷商?DigiKey?日前宣布,在 5 月 21 日至 23 日于拉斯維加斯舉辦的 2024 年 EDS 領導力峰會上,共計獲得了供應商
    發表于 06-26 15:30 ?212次閱讀
    DigiKey 在 2024 EDS <b class='flag-5'>領導力</b>峰會上斬獲供應商授予的多個最高獎項

    英偉達推出AI模型推理服務NVIDIA NIM

    英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程,為全球的2800萬英偉達開發者提供前所未有的便利。
    的頭像 發表于 06-04 09:15 ?685次閱讀

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    ,同時降低水消耗。利用NVIDIA Blackwell架構的高帶寬內存性能、NVLink-C2C和專用解壓縮引擎,GB200大幅提高關鍵數據庫查詢的速度,比CPU提升18倍,并將總體擁有成本(TCO
    發表于 05-13 17:16

    沃爾沃利用英偉達的SoC和AI來提升自動駕駛的安全性

    在2024年英偉達GPU技術大會(NVIDIA GTC 2024)上,沃爾沃介紹了如何利用人工智能和日益提升的算提升自動駕駛的安全性。
    的頭像 發表于 05-08 14:38 ?1196次閱讀

    萊迪思Avant? FPGA平臺榮獲2024年環境和能源領導力

    萊迪思半導體近日宣布萊迪思Avant? FPGA平臺榮獲2024年環境和能源領導力獎。萊迪思Avant因其在商業和基礎設施領域中展現出領先的低功耗、高性能和小尺寸特性而獲得認可。
    的頭像 發表于 04-30 14:28 ?479次閱讀
    萊迪思Avant? FPGA平臺榮獲2024年環境和能源<b class='flag-5'>領導力</b>獎

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網絡和熱
    的頭像 發表于 04-20 09:39 ?742次閱讀

    使用NVIDIA Triton推理服務器來加速AI預測

    這家云計算巨頭的計算機視覺和數據科學服務使用 NVIDIA Triton 推理服務器來加速 AI 預測。
    的頭像 發表于 02-29 14:04 ?589次閱讀

    利用NVIDIA產品技術組合提升用戶體驗

    本案例通過利用NVIDIA TensorRT-LLM加速指令識別深度學習模型,并借助NVIDIA Triton推理服務器在NVIDIA V1
    的頭像 發表于 01-17 09:30 ?703次閱讀
    主站蜘蛛池模板: vagaa哇嘎黄短片| 4399日本电影完整版在线观看免费| 久久一级视频| 国产亚洲制服免视频| 成人国产三级在线播放| 9亚洲欧洲免费无码在线| 最近免费中文MV在线字幕| 亚洲色t图| 亚洲欧美日韩人成| 亚洲AV色香蕉一区二区9255 | 日本女人bbb| 欧美一区二区视频97色伦| 欧美精品AV一区二区无码| 免费国产成人手机在线观看| 老板揉搓秘书丰满大乳| 老师在讲桌下边h边讲课| 浪潮色诱AV久久久久久久| 美女被强奷到抽搐的动态图| 蜜柚视频在线观看全集免费观看| 美女一级毛片免费不卡视频| 免费a毛片| 欧美影院在线观看完整版 mp4| 鸥美一级黄色片| 色网址在线观看| 午夜精品久久久久久99热蜜桃| 性色少妇AV蜜臀人妻无码| 亚洲精品国产A久久久久久| 亚洲午夜久久久精品影院| 宅男午夜大片又黄又爽大片| 中文日产无乱码AV在线观| 99精品视频一区在线视频免费观看| 97超碰97资源在线观看| 白丝萝莉喷水| 国产福利高清在线视频| 国产欧美一区二区精品性色tv| 果冻传媒在线看免费高清 | 亚洲一区二区三不卡高清| 中文字幕在线观看网址| cctv网站| 国产精品久久免费视频| 精品一区二区三区色花堂|