色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA 如何應對會話式AI帶來的推理挑戰?

張慧娟 ? 來源:電子發燒友網 ? 作者:張慧娟 ? 2019-11-08 16:53 ? 次閱讀

NVIDIA GPU曾于去年12月和今年7月兩度樹立了數據中心神經網絡訓練的性能標桿。今天發布的行業基準測試結果顯示,NVIDIA也引領著數據中心內部與外部AI網絡的趨勢。

NVIDIA Turing GPU和Xavier芯片系統在首個獨立AI推理基準測試 ——MLPerf Inference 0.5中取得第一名。由于推理一直是AI市場中最大、同時也是最具競爭力的領域,業內此前一直希望能夠有一套客觀的推理性能測試指標。

在參與此次測試的十二家公司中,只有NVIDIA AI平臺提交了MLPerf的全部五項推理測試成績(MLPerf是一個于2018年5月成立的行業基準測試小組)。這證明了NVIDIA CUDA-X AI和TensorRT軟件的成熟程度。它們讓用戶能夠更加輕松地將所有的NVIDIA GPU應用于數據中心、邊緣等領域。

MLPerf定義了五項推理基準,涵蓋了三個現有的人工智能應用:圖像分類、目標檢測和翻譯。每項基準分為四個場景:與數據中心應用關聯性最高的服務器和離線場景,以及用于滿足邊緣設備地芯片系統需求的單流和多流場景。
圖1:NVIDIA在兩個數據中心場景(離線和服務器)的全部五項基準測試中均排在第一位,Turing GPU被評為市面上單處理器性能最高的GPU。
圖2:NVIDIA Turing在MLPerf數據中心場景中的成績超過了其他市面上的處理器。

離線場景中具有代表性的場景有圖像標記等,該場景下所有數據可在本地使用;而服務器場景代表性場景有在線翻譯服務等,此場景下會突然或間歇性隨機出現數據和請求工作。

Xavier在兩個邊緣場景(單流和多流)中被評為市面上性能最佳的邊緣和移動芯片系統。

工業檢測相機主要被用來在快速移動的生產線上發現不合格品,這是一種典型的單流任務。多流場景則是測試芯片能夠處理多少個數據源 —— 該性能對于一輛可能需要使用6臺以上攝像機的自動駕駛汽車而言,是一項關鍵的能力。
圖3:NVIDIA Xavier在MLPerf邊緣場景中成為市面上最佳的邊緣和移動芯片系統。

該結果顯示了NVIDIA CUDA和TensorRT軟件的性能。它們為用戶提供了一個通用平臺,使用戶可以在多個產品和應用中取得領先結果,而這正是NVIDIA所獨有的能力。

在數據中心場景中,NVIDIA的兩款GPU還出現了相互競爭的場面。NVIDIA TITAN RTX展示了Turing級 GPU的巨大潛力,尤其是在各種要求苛刻的任務中,比如運行用于語言翻譯的GNMT模型等。

功能豐富、應用廣泛的NVIDIA T4 Tensor Core GPU在多個場景取得了優秀的成績。這個功耗僅為70瓦的GPU能夠輕松安裝到任何帶有PCIe槽的服務器中,使用戶能夠根據需要擴展其計算力,進而大幅擴展其推理工作。

MLPerf已經獲得行業和學術界的廣泛支持。其成員包括Arm、Facebook、Futurewei、通用汽車、Google、哈佛大學、Intel、MediaTek、微軟、NVIDIA及Xilinx。值得一提的是,相比于之前的兩次訓練比賽,此次基準測試吸引了更多的參與者。

NVIDIA此次共采用了三款產品,共計四種配置參加此次測試,并提交了全部20個場景中的19個場景的成績,以此表明公司對這項工作的支持。NVIDIA的合作伙伴Dell EMC,以及NVIDIA的客戶阿里巴巴同樣使用NVIDIA GPU提交了成績。相比于其他參與者,NVIDIA與合作伙伴和客戶一同向用戶全面地展示了NVIDIA產品組合的潛力。

全新的視角與產品

推理指的是在實時生產系統中,通過運行AI模型,從大量數據中篩選出可執行洞察的過程。這是一項仍處于發展中的新興技術,而NVIDIA也在該領域中不斷前進,未曾停止腳步。

今天,NVIDIA發布了用于MLPerf測試的Xavier芯片系統低功耗版本——Jetson Xavier NX,其最大功率僅為15瓦,卻具有最高21 TOPS的性能。它將為那些對性能要求高、但功率有限的新一代機器人無人機和其他自主設備提供驅動力。

除了新的硬件之外,NVIDIA還發布了在MLPerf基準測試中所使用的最新TensorRT 6優化,并在GitHub上以開源方式為用戶提供該軟件。用戶可以在MLPerf 開發者博客中了解更多關于這些優化的信息。NVIDIA不斷地對該軟件進行升級,使用戶可以從日益增加的AI自動化與性能中獲益。

讓推理變得更簡單

今天的MLPerf測試還說明了一個結論,那就是推理很困難。例如,在實際工作負載中,由于推理還需要大量預處理和后處理步驟,那么在實際工作負載中其對推理性能的需求甚至比基準測試更高。

NVIDIA創始人兼首席執行官黃仁勛在去年GTC大會的主題演講中就曾將這種復雜性概括為一個詞:PLASTER。他表示,現代AI推理對可編程性(Programmability)、延遲性(Latency)、準確性(Accuracy)、模型大小(Accuracy)、吞吐量(Throughput)、能效(Energy efficiency)和學習率(Rate of Learning)的要求很高。

這就是為何用戶越來越喜歡使用高性能的NVIDIA GPU和軟件來處理各種要求苛刻的推理工作,其中就包括:BMW、Capital One、思科、Expedia、John Deere、微軟、PayPal、Pinterest、寶潔、Postmates、Shazam、Snap、Shopify、Twitter、Verizon和沃爾瑪等極具遠見的公司。

本周,全球最大的郵政服務系統——美國郵政,也加入了此行列,使用NVIDIA GPU進行AI訓練和推理。

硬盤制造商希捷希望通過在NVIDIA GPU上運行的AI推理將生產量提高10%。該公司預計,通過提高效率和質量,其將獲得高達300%的投資回報。

Pinterest依靠NVIDIA GPU訓練和評估其識別模型并對其1750億條Pin貼文執行實時推理。

Snap使用NVIDIA T4加速器在谷歌云平臺上執行推理。相比于僅采用了CPU的系統,這提高了其廣告的效果,同時降低了成本。

Twitter發言人就這一趨勢表示:“GPU的使用不僅大大縮短了訓練時間,還讓我們在推理時能夠實時了解直播視頻,讓我們可以在自己的平臺上了解各媒體。”

AI會話:關于推理

未來,會話式AI將帶來大量的機會以及技術方面的挑戰。NVIDIA在這一領域同樣是當之無愧的領導者。

NVIDIA已經為會話式AI服務提供了經過優化的參照設計,比如自動語音識別、文本-語言轉換和自然語言理解等。NVIDIA們的BERT、GNMT和Jasper等AI模型開源優化幫助開發者實現頂尖推理性能。NVIDIA的客戶和合作伙伴中包括有會話式AI領域的一流公司,比如Kensho、微軟、Nuance、Optum等。

最后要補充的是,MLPerf小組已經開始致力于改進其當前的0.5推理測試。NVIDIA將努力在基準測試中繼續發揮領導作用。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4847

    瀏覽量

    129962
  • 人工智能
    +關注

    關注

    1801

    文章

    48218

    瀏覽量

    243105
  • 推理
    +關注

    關注

    0

    文章

    8

    瀏覽量

    7300
收藏 0人收藏

    評論

    相關推薦

    英偉達GTC2025亮點:Oracle與NVIDIA合作助力企業加速代理式AI推理

    Oracle 數據庫與 NVIDIA AI 相集成,使企業能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,NVIDIA
    的頭像 發表于 03-21 12:01 ?335次閱讀
    英偉達GTC2025亮點:Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業加速代理式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發表于 03-20 15:35 ?357次閱讀

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 發布了開源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴展 AI 工廠中的
    的頭像 發表于 03-20 15:03 ?411次閱讀

    Oracle 與 NVIDIA 合作助力企業加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計算和推理軟件與 Oracle 的 AI 基礎設施以及生成
    發表于 03-19 15:24 ?221次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業加速代理式 <b class='flag-5'>AI</b> <b class='flag-5'>推理</b>

    NVIDIA 推出開放推理 AI 模型系列,助力開發者和企業構建代理式 AI 平臺

    NVIDIA 后訓練的全新 Llama Nemotron 推理模型,為代理式 AI 提供業務就緒型基礎 埃森哲、Amdocs、Atlassian、Box、Cadence、CrowdStrike
    發表于 03-19 09:31 ?125次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放<b class='flag-5'>推理</b> <b class='flag-5'>AI</b> 模型系列,助力開發者和企業構建代理式 <b class='flag-5'>AI</b> 平臺

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業節省了數百萬美元。
    的頭像 發表于 02-08 09:59 ?416次閱讀
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>平臺提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

    生成AI推理技術、市場與未來

    OpenAI o1、QwQ-32B-Preview、DeepSeek R1-Lite-Preview的相繼發布,預示著生成AI研究正從預訓練轉向推理(Inference),以提升AI
    的頭像 發表于 01-20 11:16 ?591次閱讀
    生成<b class='flag-5'>式</b><b class='flag-5'>AI</b><b class='flag-5'>推理</b>技術、市場與未來

    NVIDIA助力Amdocs打造生成AI智能體

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發和交付基于商用大語言模型(LLM)和領域適配模型的解決方案。該公司還在使用NVIDIA
    的頭像 發表于 11-19 14:48 ?581次閱讀

    NVIDIA助力麗蟾科技打造AI訓練與推理加速解決方案

    麗蟾科技通過 Leaper 資源管理平臺集成 NVIDIA AI Enterprise,為企業和科研機構提供了一套高效、靈活的 AI 訓練與推理加速解決方案。無論是在復雜的
    的頭像 發表于 10-27 10:03 ?472次閱讀
    <b class='flag-5'>NVIDIA</b>助力麗蟾科技打造<b class='flag-5'>AI</b>訓練與<b class='flag-5'>推理</b>加速解決方案

    NVIDIA與思科合作打造企業級生成AI基礎設施

    NVIDIA 加速計算平臺、NVIDIA AI Enterprise 軟件和 NVIDIA NIM 推理微服務加持的思科 Nexus H
    的頭像 發表于 10-10 09:35 ?543次閱讀

    AI普及給嵌入設計人員帶來挑戰

    探討了人工智能(AI)的普及給嵌入設計人員帶來的新挑戰。在創建“邊緣機器學習(ML)”應用時,設計人員必須確保其能有效運行,同時最大限度地降低處理器和存儲開銷,以及物聯網(IoT)設
    發表于 08-22 14:20 ?787次閱讀
    <b class='flag-5'>AI</b>普及給嵌入<b class='flag-5'>式</b>設計人員<b class='flag-5'>帶來</b>新<b class='flag-5'>挑戰</b>

    NVIDIA攜手Meta推出AI服務,為企業提供生成AI服務

    NVIDIA近日宣布了一項重大舉措,正式推出NVIDIA AI Foundry服務與NVIDIA NIM(NVIDIA Inference
    的頭像 發表于 07-25 16:57 ?675次閱讀

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務,與同樣剛推出的 Llama 3.1
    的頭像 發表于 07-25 09:48 ?880次閱讀

    英偉達推出AI模型推理服務NVIDIA NIM

    英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程,為全球的2800萬英偉達開發者提供前所未有的便利。
    的頭像 發表于 06-04 09:15 ?829次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將
    的頭像 發表于 04-20 09:39 ?925次閱讀
    主站蜘蛛池模板: 脱女学小内内摸出水网站免费 | 在线观看成人3d动漫入口 | 人妻熟妇乱又伦精品视频中文字幕 | 为什么丈夫插我我却喜欢被打着插 | 精品一卡2卡三卡4卡乱码精品视频 | 在线超碰免费视频观看 | 蜜柚视频在线观看全集免费观看 | 95国产精品人妻无码久 | 污污内射在线观看一区二区少妇 | 最近的2019中文字幕HD | 777ZYZ玖玖资源站最稳定网址 | 国产免费麻传媒精品国产AV | 欧美Av无码高清在线 | 久章草一区二区 | 豆奶视频在线高清观看 | 国产精品久久久久一区二区三区 | 亚洲精品动漫免费二区 | 日韩欧美视频一区二区在线观看 | 麻豆一区二区免费播放网站 | 特黄AAAAAAA片免费视频 | 久草网国产自偷拍 | 国产精品成人啪精品视频免费观看 | 亚洲色婷婷久久精品AV蜜桃 | 99久久99| 健身房被教练啪到腿软H | 好大的太粗好深BL | 亚洲欧美自拍明星换脸 | 久久久久激情免费观看 | 精品久久伊人 | 亚洲欧美日韩中字视频三区 | 毛片免费观看视频 | 人妻无码AV中文系列 | 99草在线观看 | 成人国产在线不卡视频 | 国产成人在线观看网站 | 嫩草影院久久精品 | 国产一区二区三区乱码在线观看 | 亚洲欧美综合视频 | 色偷偷爱偷偷要 | ppypp午夜限制不卡影院私人 | 少妇精品久久久一区二区三区 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品