色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MLPerf 聯(lián)盟公布7項(xiàng)測試構(gòu)成了當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域的全新行業(yè)基準(zhǔn)測試

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:lq ? 2018-12-24 14:12 ? 次閱讀

近日,MLPerf 聯(lián)盟公布了其7項(xiàng)測試的首批結(jié)果,此7項(xiàng)測試構(gòu)成了當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域的全新行業(yè)基準(zhǔn)測試。NVIDIA參與了其中6個(gè)類別的測試,在這6項(xiàng)測試中,從單節(jié)點(diǎn)測試到大規(guī)模測試,NVIDIA平臺的測試結(jié)果都遙遙領(lǐng)先,證明了NVIDIA平臺方法在加速機(jī)器學(xué)習(xí)領(lǐng)域的強(qiáng)大實(shí)力。

MLPerf 聯(lián)盟的宗旨是“ 致力于確立一套通用的基準(zhǔn)測試,助力機(jī)器學(xué)習(xí) (ML) 領(lǐng)域跨移動(dòng)設(shè)備和云服務(wù)測量系統(tǒng)的訓(xùn)練和推理性能?!盢VIDIA 一直以來都是 MLPerf 聯(lián)盟的主要成員,與其他成員一同積極構(gòu)建、完善和發(fā)展首套商定一致的工作負(fù)載,以便可以跨用例范圍地直接比較各平臺性能。

作為快速成長的新興市場,機(jī)器學(xué)習(xí)領(lǐng)域缺少用來評估平臺性能的行業(yè)測試基準(zhǔn)。雖然 ResNet-50 等網(wǎng)絡(luò)經(jīng)常用作訓(xùn)練和推理的性能代理,但其仍是一套主要基于圖像任務(wù)的單一CNN,不能提供機(jī)器學(xué)習(xí)平臺的完整性能圖景。機(jī)器學(xué)習(xí)還包含許多其他用例,例如語音、翻譯和推薦系統(tǒng)等。

認(rèn)識 MLPerf

MLPerf 的關(guān)鍵設(shè)計(jì)目標(biāo)之一是工作負(fù)載的多樣化。因此,它涵蓋了對圖像和自然語言的使用,以及推薦系統(tǒng)和強(qiáng)化學(xué)習(xí)等,共 7 項(xiàng)測試。目前,這些工作負(fù)載僅可用于測試訓(xùn)練,未來版本的工作負(fù)載將計(jì)劃以推理為重點(diǎn)。

NVIDIA最初致力于研究封閉組,旨在針對ML訓(xùn)練系統(tǒng)(包括硬件和軟件)提供有價(jià)值的對比。為實(shí)現(xiàn)這一目標(biāo),封閉組要求所有提交成果均使用相同的數(shù)據(jù)準(zhǔn)備和訓(xùn)練程序來訓(xùn)練相同的神經(jīng)網(wǎng)絡(luò)模型架構(gòu)。從應(yīng)用程序角度看,這將確保所有條目盡可能等同,性能的差異只歸因于軟件、硬件或規(guī)模不同。選擇封閉組的網(wǎng)絡(luò)模型、數(shù)據(jù)集和訓(xùn)練程序作為當(dāng)今機(jī)器學(xué)習(xí)社區(qū)中的通用計(jì)算方法。另一方面,公開組不用于系統(tǒng)對比,而是用于鼓勵(lì)網(wǎng)絡(luò)模型架構(gòu)和其算法方面的創(chuàng)新。

NVIDIA提交了7項(xiàng)測試類別中的6類測試結(jié)果,未提交強(qiáng)化學(xué)習(xí)測試,是因?yàn)檫@項(xiàng)測試基于戰(zhàn)略游戲《GO》,該游戲最初在配備Tesla P100 GPU的服務(wù)器上進(jìn)行開發(fā)。但目前情況是,服務(wù)器中包含重要的CPU組件,因此只能提供有限的擴(kuò)展。

MLPerf分?jǐn)?shù)的計(jì)算方法是,首先測量訓(xùn)練到達(dá)指定目標(biāo)精度的時(shí)間,然后歸一化為參考平臺上未執(zhí)行優(yōu)化所需的時(shí)間。歸一化的目的是將不同的基準(zhǔn)測試轉(zhuǎn)化為相似的分?jǐn)?shù)量級,因?yàn)楦骰鶞?zhǔn)測試所需的訓(xùn)練時(shí)間不同。訓(xùn)練時(shí)間和 MLPerf 分?jǐn)?shù)均發(fā)布在 MLPerf 網(wǎng)站上,為此我們以分鐘為單位公布訓(xùn)練時(shí)間。以下是 NVIDIA 達(dá)到收斂結(jié)果的時(shí)間,包括單節(jié)點(diǎn)和大規(guī)模的實(shí)現(xiàn):

單節(jié)點(diǎn)封閉組 GPU 性能:

測試平臺:DGX-2H – 雙路Xeon Platinum 8174、1.5TB 系統(tǒng) RAM、16 個(gè) 32GB Tesla V100 SXM-3 GPU通過NVSwitch互通。

大規(guī)模封閉組 GPU 性能:

測試平臺:DGX-1V 集群,適用于圖像分類和非重復(fù)性翻譯。DGX-2H 集群,適用于重型物體檢測和輕量型物體檢測、重復(fù)性翻譯。每個(gè)DGX-1V配備雙路 Xeon E5-2698 V4、512GB 系統(tǒng) RAM、8 個(gè)16GB Tesla V100 SXM-2 GPU。每個(gè)DGX-2H配備雙路Xeon Platinum 8174、1.5TB系統(tǒng)RAM、16個(gè)32GB Tesla V100 SXM-3 GPU通過NVSwitch互通。

從以上數(shù)字可以看出:單個(gè)DGX-2節(jié)點(diǎn)能夠在20分鐘內(nèi)完成多數(shù)工作負(fù)載。在大規(guī)模提交中,除1次測試外,都在7分鐘內(nèi)完成這些任務(wù)。與第二快的提交相比,GPU的交付速度提高達(dá) 5.3 倍。鑒于深度學(xué)習(xí)早期階段的訓(xùn)練以天和周計(jì)算,上述完成時(shí)間證明我們在過去幾年中取得了巨大進(jìn)步。以下圖表說明我們在訓(xùn)練 ResNet-50 模型方面取得的進(jìn)步程度:

很顯然,因?yàn)橐幌盗衅脚_創(chuàng)新,過去幾年里性能提升巨大。這些創(chuàng)新包括:

NVLink 結(jié)構(gòu)技術(shù):Pascal 架構(gòu)中引入NVLink允許GPU以300GB/秒的速度進(jìn)行通信,比PCIe快近10倍。

Tensor Cores:Volta架構(gòu)中引入Tensor Cores,加速了大型矩陣運(yùn)算(這是AI的核心),在單次運(yùn)算中執(zhí)行混合精度矩陣乘法和累加計(jì)算。

NVSwitch:首款節(jié)點(diǎn)交換架構(gòu),在單個(gè)服務(wù)器節(jié)點(diǎn)中支持16個(gè)全互聯(lián)GPU,并驅(qū)動(dòng)全部8對GPU 分別以300GB/s的速度同時(shí)通信。這16個(gè)GPU 還可作為單個(gè)大型加速器,擁有0.5TB的統(tǒng)一內(nèi)存空間和每秒2千萬億次的深度學(xué)習(xí)計(jì)算性能。

全棧優(yōu)化:方法得當(dāng)

NVIDIA的加速深度學(xué)習(xí)方法包含整套平臺,并在硬件、軟件和生態(tài)系統(tǒng)支持下持續(xù)創(chuàng)新。這種方法為深度學(xué)習(xí)社區(qū)帶來巨大的優(yōu)勢,允許開發(fā)人員在任何提供商的云服務(wù)上使用任何熱門框架,或者使用自己的GPU基礎(chǔ)架構(gòu)實(shí)現(xiàn)卓越的性能。NVIDIA向MLPerf提交的測試使用MXNet處理圖像分類工作負(fù)載(ResNet-50),使用PyTorch提交涵蓋翻譯、對象檢測和實(shí)例分割以及推薦器的工作負(fù)載。谷歌的TernsorFlow團(tuán)隊(duì)也展示了在谷歌云平臺上使用NVIDIA V100 GPU處理ResNet-50的出色表現(xiàn)。

這些框架均可在NVIDIA GPU云(NGC)容器注冊服務(wù)器中免費(fèi)獲取,并且每月更新一次,性能持續(xù)改進(jìn)。此前發(fā)表的一篇博客中說明 11 月 18.11 版本的容器中對 NVIDIA 深度學(xué)習(xí)軟件堆棧的最新改進(jìn)。以下將簡述這些改進(jìn):

MXNet

添加了 Horovod,改進(jìn)跨多個(gè)節(jié)點(diǎn)訓(xùn)練的性能。

借助小批量 (<= 32) 優(yōu)化大規(guī)模多節(jié)點(diǎn)訓(xùn)練的性能

有關(guān)更多詳細(xì)信息,請參閱AWS上的博客,其中具體概述了MXNet的最新改進(jìn)。

TensorFlow

更新了XLA圖形編譯器,優(yōu)化了運(yùn)算符融合以節(jié)省內(nèi)存帶寬,優(yōu)化了Tensor Core數(shù)據(jù)布局。谷歌最近的一篇博客詳細(xì)介紹了更具體的細(xì)節(jié)。

PyTorch

Apex中新添實(shí)用程序,并融合實(shí)施Adam優(yōu)化器,通過減少冗余GPU設(shè)備內(nèi)存通道、改進(jìn)卷積翻譯模型的層歸一化性能以及為多進(jìn)程和多節(jié)點(diǎn)訓(xùn)練改進(jìn)DistributedDataParallel包裝器,以提高性能。

cuDNN

多方面顯著性改進(jìn)了卷積性能,尤其在每個(gè)GPU 小批量處理數(shù)據(jù)之時(shí);優(yōu)化了Tensor Core的Persistent RNNs算法。

DALI

對象檢測模型所需的各種圖像預(yù)處理例程提速,現(xiàn)在它們可在GPU上運(yùn)行,而無需CPU。

結(jié)束語

NVIDIA對第一組公布結(jié)果感到深受鼓舞,并對在AI社區(qū)中與各個(gè)框架開發(fā)團(tuán)隊(duì)的合作深感自豪。MLPerf作為一種工具,允許AI平臺制造商使用一組商定的用例來比較他們的產(chǎn)品,我們將繼續(xù)與MLPerf聯(lián)盟合作,并隨AI工作負(fù)載的進(jìn)展,迭代這一基準(zhǔn)。以上這些技術(shù)現(xiàn)已面向AI開發(fā)者社區(qū)開放,可從我們的 NGC容器注冊服務(wù)器獲取。敬請關(guān)注我們的開發(fā)者博客更新,了解有關(guān) TensorFlow、PyTorch和MXNet框架中的具體優(yōu)化的更多信息。www.mlperf.org 上提供MLPerf基準(zhǔn)模型,可根據(jù)相關(guān)基準(zhǔn)目錄中的自述文件運(yùn)行。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4999

    瀏覽量

    103223
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8423

    瀏覽量

    132752
  • 自然語言
    +關(guān)注

    關(guān)注

    1

    文章

    288

    瀏覽量

    13359
  • MLPerf
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    646

原文標(biāo)題:NVIDIA 在全球首個(gè)全行業(yè) AI 基準(zhǔn)測試中拔得頭籌

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    突破防水極限,IP68防水測試設(shè)備引領(lǐng)行業(yè)前行

    著整個(gè)行業(yè)不斷前行。IP68防水等級代表了當(dāng)前防水技術(shù)的巔峰。其中,“IP”是國際防護(hù)等級的縮寫,數(shù)字“6”表示設(shè)備能夠完全防止灰塵進(jìn)入,而數(shù)字“8”則意味著設(shè)備
    的頭像 發(fā)表于 12-27 14:04 ?97次閱讀
    突破防水極限,IP68防水<b class='flag-5'>測試</b>設(shè)備引領(lǐng)<b class='flag-5'>行業(yè)</b>前行

    MLCommons推出AI基準(zhǔn)測試0.5版

    開放式機(jī)器學(xué)習(xí)工程聯(lián)盟 MLCommons 在美國加州當(dāng)?shù)貢r(shí)間公布推出適用于消費(fèi)類 PC 的 AI 性能的 MLPerf Client
    的頭像 發(fā)表于 12-12 16:47 ?337次閱讀

    星閃聯(lián)盟認(rèn)證 SLE SLB測試

    行業(yè)標(biāo)準(zhǔn)。一、申請流程:輕松便捷1.產(chǎn)品廠商注冊星閃聯(lián)盟會員2.向聯(lián)盟秘書處報(bào)備產(chǎn)品測試3.測試實(shí)驗(yàn)室設(shè)備
    的頭像 發(fā)表于 11-15 16:59 ?234次閱讀
    星閃<b class='flag-5'>聯(lián)盟</b>認(rèn)證 SLE SLB<b class='flag-5'>測試</b>

    浪潮信息AI存儲性能測試的領(lǐng)先之道

    AI技術(shù)的無限可能。近日,在MLCommons的子項(xiàng)目MLPerf Storage v1.0性能基準(zhǔn)評測中,浪潮信息再度展現(xiàn)了在AI存儲領(lǐng)域的卓越實(shí)力。
    的頭像 發(fā)表于 10-29 16:30 ?261次閱讀
    浪潮信息AI存儲性能<b class='flag-5'>測試</b>的領(lǐng)先之道

    DaVinci系統(tǒng)級基準(zhǔn)測試測量

    電子發(fā)燒友網(wǎng)站提供《DaVinci系統(tǒng)級基準(zhǔn)測試測量.pdf》資料免費(fèi)下載
    發(fā)表于 10-16 11:32 ?0次下載
    DaVinci系統(tǒng)級<b class='flag-5'>基準(zhǔn)</b><b class='flag-5'>測試</b>測量

    基準(zhǔn)測試C55 DSP庫說明

    電子發(fā)燒友網(wǎng)站提供《基準(zhǔn)測試C55 DSP庫說明.pdf》資料免費(fèi)下載
    發(fā)表于 10-11 10:08 ?0次下載
    <b class='flag-5'>基準(zhǔn)</b><b class='flag-5'>測試</b>C55 DSP庫說明

    柔性測試技術(shù)的應(yīng)用領(lǐng)域

    柔性測試技術(shù)是以多種相關(guān)技術(shù)為基礎(chǔ),可滿足復(fù)雜、多樣化的測試測量需求的系統(tǒng)化技術(shù)。它的應(yīng)用領(lǐng)域廣泛,涵蓋了多個(gè)重要行業(yè),以下是關(guān)于柔性測試
    的頭像 發(fā)表于 10-08 18:03 ?537次閱讀

    浪潮信息AS13000G7榮獲MLPerf? AI存儲基準(zhǔn)測試項(xiàng)性能全球第一

    獎(jiǎng)得主大衛(wèi)?帕特森(David Patterson)聯(lián)合頂尖學(xué)術(shù)機(jī)構(gòu)發(fā)起成立。2023年推出MLPerf? 存儲基準(zhǔn)性能測試,旨在以架構(gòu)中立、具有代表性和可重復(fù)的方式衡量機(jī)器
    的頭像 發(fā)表于 09-28 16:46 ?221次閱讀
    浪潮信息AS13000G<b class='flag-5'>7</b>榮獲<b class='flag-5'>MLPerf</b>? AI存儲<b class='flag-5'>基準(zhǔn)</b><b class='flag-5'>測試</b>五<b class='flag-5'>項(xiàng)</b>性能全球第一

    華為云圖引擎服務(wù)GES震撼業(yè)界,刷新基準(zhǔn)測試世界紀(jì)錄

    9月26日,國際知名的關(guān)聯(lián)數(shù)據(jù)基準(zhǔn)委員會(LDBC)最新公布的社交網(wǎng)絡(luò)測試交互式負(fù)載(SNB)成績單上,華為云的圖引擎服務(wù)(GES)大放異彩,圓滿通過了所有基于聲明式查詢語言的基準(zhǔn)
    的頭像 發(fā)表于 09-27 14:28 ?498次閱讀

    Sitara? AM62Ax基準(zhǔn)測試

    電子發(fā)燒友網(wǎng)站提供《Sitara? AM62Ax基準(zhǔn)測試.pdf》資料免費(fèi)下載
    發(fā)表于 09-07 10:41 ?0次下載
    Sitara? AM62Ax<b class='flag-5'>基準(zhǔn)</b><b class='flag-5'>測試</b>

    如何理解機(jī)器學(xué)習(xí)中的訓(xùn)練集、驗(yàn)證集和測試

    理解機(jī)器學(xué)習(xí)中的訓(xùn)練集、驗(yàn)證集和測試集,是掌握機(jī)器學(xué)習(xí)核心概念和流程的重要一步。這三者不僅構(gòu)成了
    的頭像 發(fā)表于 07-10 15:45 ?4282次閱讀

    名單公布!【書籍評測活動(dòng)NO.35】如何用「時(shí)間序列與機(jī)器學(xué)習(xí)」解鎖未來?

    捕捉復(fù)雜非線性模式的場景中顯得力不從心。 將時(shí)間序列的分析與預(yù)測用于大規(guī)模的數(shù)據(jù)生產(chǎn)一直存在諸多困難。 在這種背景下,結(jié)合機(jī)器學(xué)習(xí),特別是深度學(xué)習(xí)技術(shù)的時(shí)間序列分析方法,成了研究和應(yīng)用
    發(fā)表于 06-25 15:00

    機(jī)器視覺行業(yè)就率將迎來一輪“洗牌賽”

    盡管當(dāng)前機(jī)器視覺領(lǐng)域的相關(guān)企業(yè)普遍面臨挑戰(zhàn),但長遠(yuǎn)來看,隨著技術(shù)的進(jìn)步和市場需求的增長,機(jī)器視覺在工業(yè)自動(dòng)化、智能制造乃至其他領(lǐng)域將有巨大的應(yīng)用潛力。
    發(fā)表于 03-26 11:10 ?906次閱讀

    通用CPU性能基準(zhǔn)測試的研究現(xiàn)狀

    經(jīng)過持續(xù)迭代升級,TPC已發(fā)展成為能夠滿足多種應(yīng)用場景性能測試需求的基準(zhǔn)測試簇,根據(jù)測試場景和測試事務(wù)的不同,可將 TPC性能
    發(fā)表于 02-20 10:22 ?722次閱讀
    通用CPU性能<b class='flag-5'>基準(zhǔn)</b><b class='flag-5'>測試</b>的研究現(xiàn)狀

    不同類型的SAN都需要測試哪些射頻測試項(xiàng)?

    如果對4G/5G基站測試有所了解,那么SAN的測試項(xiàng)也不會陌生,因?yàn)橥耆前凑?G/5G基站的標(biāo)準(zhǔn)作為模板,只是項(xiàng)目有所減少。
    的頭像 發(fā)表于 01-08 09:51 ?1274次閱讀
    主站蜘蛛池模板: 成年人免费观看的视频| 国语自产视频在线不卡| 99re6久久热在线播放| 坠落的丝袜美人妻| 3d在线看小舞被躁视频| 99久久香蕉| 成人在线不卡视频| 国产精品点击进入在线影院高清| 国产精品永久免费视频| 精品国产手机视频在在线| 久久国产亚洲精品AV麻豆| 美国色吧影院| 日韩av片无码一区二区不卡电影| 美女直播喷水| 男生在床上脱美女 胸| 日本精品久久久久中文字幕| 特级毛片内射WWW无码| 亚洲成 人a影院青久在线观看| 一本色道久久88综合日韩精品| 2019在秋霞理论| 年轻夫妇韩剧中文版免费观看| 欧美最猛性XXXXX肛交| 王晶三级作品| 夜月视频直播免费观看| 99久久99久久久精品齐齐鬼色 | 菊地凛子av| 日本老妇一级特黄aa大片| 亚洲国产货青视觉盛宴| 2019久久视频这里有精品15| 大香伊蕉在人线国产最新| 狠狠色色综合站| 欧美午夜精品一区二区蜜桃| 学校女性奴sm训练调教| 96.8在线收听| 国产精品久久久久永久免费看| 久久久精品久久久久久| 日本亚洲中文字幕无码区| 亚洲一区在线观看视频| 草莓视频cm.888tw| 紧致肉肉高h| 色多多污版app下载网站|