亚洲香蕉久久一区二区三区四区,亚洲黄色色图,亚洲麻豆精品果冻传媒

你還在頭疼于經典模型的復現嗎？不知何處可以得到全面可參照的 Benchmark？

為了讓飛槳開發者可以快速復現頂尖的精度和超高的性能，NVIDIA 與飛槳團隊合作開發了基于 ResNet50 的模型示例，并將持續開發更多的基于 NLP 和 CV 等領域的經典模型，后續陸續發布的模型有 BERT、PP-OCR、PP-YOLO 等，歡迎持續關注。

深度學習模型是什么？

深度學習包括訓練和推理兩個環節。訓練是指通過大數據訓練出一個復雜的神經網絡模型，即用大量標記過的數據來“訓練”相應的系統，使之可以適應特定的功能。推理是指利用訓練好的模型，使用新數據推理出各種結論。深度學習模型是在訓練工作過程中生成，并將其保存，用于推理當中。

深度學習訓練推理示意圖

NVIDIA Deep Learning Examples

全新上線飛槳 ResNet50

NVIDIA Deep Learning Examples 倉庫上線了基于飛槳實現的 ResNet50 模型的性能優化結果，該示例全面適配各類 NVIDIA GPU 和各種硬件拓撲（單機單卡，單機多卡），極致優化性能。值得一提的是，Deep Learning Examples 中飛槳 ResNet50 模型訓練速度已超過對應的 PyTorch 版 ResNet50。

NVIDIA Deep Learning Examples 倉庫中基于飛槳與 PyTorch 的 ResNet50 模型在同等 GPU 配置下的訓練性能比較，GPU 配置為 NVIDIA DGX A100（8x A100 80GB）。

*數據來源：［1］［2］

NVIDIA Deep Learning Examples 倉庫中飛槳 ResNet50 有哪些優勢？

優勢一：通過使用 DALI 等工具，加速 GPU 數據預處理性能

NVIDIA Data Loading Library（ DALI ）專注于使用 GPU 加速深度學習應用中的數據加載和預處理。深度學習數據預處理涉及到復雜的、多個階段的處理過程，如 ResNet50 模型訓練過程中，在 CPU 上處理圖片的加載、解碼、裁剪、翻轉、縮放和其他數據增強等操作會成為瓶頸，限制訓練和推理的性能和可擴展性。DALI 將這些操作轉移到 GPU 上，最大限度地提高輸入流水線的吞吐量，并且其中數據預取，并行執行和批處理的操作對用戶是透明的。

優勢二：通過使用 AMP，ASP 等工具，提高推理性能

飛槳內置支持 AMP（自動混合精度）及 ASP（自動稀疏化）模塊，AMP 模塊可在模型訓練過程中，自動為算子選擇合適的計算精度（FP32/FP16），充分利用 Tensor Cores 的性能，在不影響模型精度的前提下，大幅加速模型訓練。

ASP 模塊實現了一個工作流將深度學習模型從稠密修剪為 2：4 的稀疏模式，經過重訓練之后，可恢復到與稠密模型相當的精度。稀疏模型可以充分利用 A100 Tensor Core GPU 的加速特性，被修剪的權重矩陣參數存儲量減半，并且可以獲得理論上 2 倍的計算加速，從而大幅提高推理性能。

優勢三：通過集成 TensorRT，優化推理模型

飛槳推理集成了 TensorRT，稱為 Paddle-TRT。它可以把部分模型子圖交給 TensorRT 加速，而其他部分仍然用飛槳執行，從而達到最佳的推理性能。

優勢四：豐富的 Benchmark

NVIDIA Deep Learning Examples 倉庫中

有哪些 Benchmark？

NVIDIA Deep Learning Examples 倉庫中的 Benchmark 主要包含訓練精度結果、訓練性能結果、推理性能結果、Paddle-TRT 性能結果幾個方面。

1、訓練精度結果

訓練精度： NVIDIA DGX A100 （8x A100 80GB）

*數據來源：［1］

集成 ASP 的提高精度： NVIDIA DGX A100 （8x A100 80GB）

*數據來源：［1］

2、訓練性能結果

訓練性能： NVIDIA DGX A100 （8x A100 80GB）

*數據來源：［1］

集成 ASP 的訓練性能： NVIDIA DGX A100 （8x A100 80GB）

*數據來源：［1］

3、推理性能結果

推理性能： NVIDIA DGX A100 （1x A100 80GB）

*數據來源：［1］

4、Paddle-TRT 性能結果

Paddle-TRT 性能結果： NVIDIA DGX A100 （1x A100 80GB）

*數據來源：［1］

Paddle-TRT 性能結果： NVIDIA A30 （1x A30 24GB）

*數據來源：［1］

Paddle-TRT 性能結果： NVIDIA A10 （1x A10 24GB）

*數據來源：［1］

如何下載 NVIDIA Deep Learning Examples 中的飛槳 ResNet50？

登錄 GitHub NVIDIA Deep Learning Examples 倉庫，找到 PaddlePaddle/Classification/RN50/1.5，下載模型源代碼即可。

NVIDIA Deep Learning Examples 飛槳 ResNet50 下載頁面

飛槳容器如何安裝？

容器包含了深度學習框架在運行時所需的所有部件（包括驅動，工具包等），它具有輕量化與可復制性、打包和執行環境合二為一以及簡化應用程序部署等優勢，因此，被認為是在同一環境中實現“構建、測試、部署”的最佳平臺。容器允許我們創建標準化可復制的輕量級開發環境，擺脫來自 Hypervisor 所帶來運行開銷。應用程序可以基于 Container Runtime 運行在“任意”系統中。

NVIDIA 與百度飛槳聯合開發了 NGC 飛槳容器，將最新版本的飛槳與最新的 NVIDIA 的軟件棧進行了無縫的集成與性能優化，最大程度的釋放飛槳框架在 NVIDIA 最新硬件上的計算能力。這樣，用戶不僅可以快速開啟 AI 應用，專注于創新和應用本身，還能夠在 AI 訓練和推理任務上獲得飛槳+NVIDIA 帶來的飛速體驗。

NGC 飛槳容器已經集成入飛槳官網主頁。你可以選擇 “飛槳版本”+“Linux”+“Docker”+“CUDA 11.7”找到對應的 Container 下載指令。

并參考《NGC 飛槳容器安裝指南》下載安裝：https://www.paddlepaddle.org.cn/documentation/docs/zh/install/install_NGC_PaddlePaddle_ch.html

運行結果如下：

審核編輯：彭靜

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

NVIDIA

NVIDIA

+關注

關注
14

文章
5107

瀏覽量
104469
模型

模型

+關注

關注
1

文章
3415

瀏覽量
49477
大數據

大數據

+關注

關注
64

文章
8929

瀏覽量
138272
飛槳

飛槳

+關注

關注
0

文章
33

瀏覽量
2357

原文標題：NVIDIA Deep Learning Examples飛槳ResNet50模型上線訓練速度超PyTorch ResNet50

文章出處：【微信號：NVIDIA-Enterprise，微信公眾號：NVIDIA英偉達企業解決方案】歡迎添加關注！文章轉載請注明出處。

GaN HEMT的SPICE模型使用指南及示例

GaN HEMT的SPICE模型使用指南及示例總結本文檔基于GaN HEMT的實測特性描述了當前版本的模型。該模型專為與PSpice和LTspice配合使用而

發表于 03-11 17:43 ?148次閱讀

GaN HEMT的SPICE<b class='flag-5'>模型</b>使用指南及<b class='flag-5'>示例</b>

如何在C#中部署飛槳PP-OCRv4模型

《超4萬6千星的開源OCR黑馬登場，PaddleOCR憑什么脫穎而出？》收到了讀者熱烈反響c，很多讀者提出：如何在C#中部署飛槳PP-OCRv4模型？本文從零開始詳細介紹整個過程。

發表于 02-17 10:58 ?1127次閱讀

如何在C#中部署<b class='flag-5'>飛</b><b class='flag-5'>槳</b>PP-OCRv4<b class='flag-5'>模型</b>

使用OpenVINO C# API輕松部署飛槳PP-OCRv4模型

? 作者：算力魔方創始人/英特爾創新大使劉力《超4萬6千星的開源OCR黑馬登場，PaddleOCR憑什么脫穎而出？》收到了讀者熱烈反響，很多讀者提出：如何在C#中部署飛槳PP-OCRv4模型

發表于 02-12 10:42 ?842次閱讀

使用OpenVINO C# API輕松部署<b class='flag-5'>飛</b><b class='flag-5'>槳</b>PP-OCRv4<b class='flag-5'>模型</b>

Orange與OpenAI、Meta合作開發非洲語言AI大模型

OpenAI和Meta將攜手法國電信運營商Orange SA，共同開發針對非洲語言的人工智能大模型。該項目旨在解決非洲大陸數千種方言模型短缺的問題，計劃于明年上半年正式啟動。

發表于 12-02 11:00 ?386次閱讀

在Ubuntu 24.04 LTS上安裝飛槳PaddleX

了眾多開箱即用的預訓練模型，可以實現模型從訓練到推理的全流程開發，支持國內外多款主流硬件，助力AI 開發者進行產業實踐。 ? 本文將介紹在Ubuntu 24.04.1LTS上從零開始安

發表于 11-11 17:45 ?440次閱讀

在Ubuntu 24.04 LTS上安裝<b class='flag-5'>飛</b><b class='flag-5'>槳</b>PaddleX

基于改進ResNet50網絡的自動駕駛場景天氣識別算法

摘要：為了充分利用自動駕駛汽車路測圖像數據，增加行駛過程中對天氣情況識別的準確性，提出了一種基于改進ResNet50網絡的自動駕駛場景天氣識別算法。該算法將SE模塊與ResNet50網絡相結合，通過

發表于 11-09 11:14 ?1058次閱讀

基于改進<b class='flag-5'>ResNet50</b>網絡的自動駕駛場景天氣識別算法

凌智電子加入飛槳技術伙伴計劃，攜手PaddleX為視覺模組產品賦能添“智”

近日，福州市凌睿智捷電子有限公司（以下簡稱凌智電子）正式加入飛槳技術伙伴計劃。雙方將共同探索人工智能技術在邊緣端部署中的創新與應用。凌智電子將憑借其在邊緣計算領域的豐富經驗，結合飛槳低

發表于 11-01 08:07 ?394次閱讀

凌智電子加入<b class='flag-5'>飛</b><b class='flag-5'>槳</b>技術伙伴計劃，攜手PaddleX為視覺模組產品賦能添“智”

NVIDIA擬與印度合作開發AI芯片

近日，據媒體報道，全球領先的圖形處理器制造商NVIDIA提出了與印度合作開發人工智能芯片的計劃。此舉旨在充分利用印度豐富的半導體設計人才資源，并深入拓展當地日益增長的市場。 NVIDIA的這一

發表于 10-24 11:17 ?601次閱讀

NVIDIA Modulus助力風阻預測模型實現

NVIDIA 與百度飛槳雙方技術團隊通過在數據、算法、模型等多個方面的合作，共同打造了一款適用于

發表于 08-23 17:10 ?1033次閱讀

TI (德州儀器) 團隊到訪飛凌嵌入式總部，深化交流與合作

7月10日，TI (德州儀器) Sitara MPU業務負責人及TI中國區技術業務團隊一行來到飛凌嵌入式保定總部進行交流，與飛凌嵌入式的企業負責人以及技術和產品團隊進行了會談。雙方就產

發表于 07-12 15:29 ?1057次閱讀

NVIDIA與百度飛槳攜手革新汽車風阻預測:DNNFluid-Car模型的崛起

在追求更高效、更環保的汽車設計浪潮中，NVIDIA與百度飛槳攜手突破傳統界限，共同研發了一款革命性的3D高精度汽車風阻預測模型——DNNFluid-Car。這款

發表于 07-09 14:56 ?1792次閱讀

百度發布文心大模型4.0 Turbo與飛槳框架3.0,引領AI技術新篇章

SUMMIT深度學習開發者大會2024上，向世界展示了百度在AI領域的最新成果——文心大模型4.0 Turbo和飛槳框架3.0，并詳細披露了飛

發表于 06-29 16:03 ?798次閱讀

NVIDIA與Google DeepMind合作推動大語言模型創新

支持 NVIDIA NIM 推理微服務的谷歌最新開源模型 PaliGemma 首次亮相。

發表于 05-16 09:44 ?556次閱讀

科大訊飛與華中師范大學合作大模型賦能教育

科大訊飛與華中師范大學合作大模型賦能教育日前華中師范大學與科大訊飛股份有限公司簽署戰略合作協議；雙方將圍繞大

發表于 04-15 15:12 ?1019次閱讀

技術團隊們合作開發低溫電路

富士通（Fujitsu）與 QuTech 合作開發了被稱作 "世界首創"的低溫電子電路，用于控制基于金剛石的量子比特。這項新技術在保持高質量性能的同時，解決了量子比特冷卻過程中的 "線路瓶頸

發表于 03-13 12:36 ?457次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

NVIDIA 與飛槳團隊合作開發基于 ResNet50 的模型示例

評論

GaN HEMT的SPICE模型使用指南及示例

如何在C#中部署飛槳PP-OCRv4模型

使用OpenVINO C# API輕松部署飛槳PP-OCRv4模型

Orange與OpenAI、Meta合作開發非洲語言AI大模型

在Ubuntu 24.04 LTS上安裝飛槳PaddleX

基于改進ResNet50網絡的自動駕駛場景天氣識別算法

凌智電子加入飛槳技術伙伴計劃，攜手PaddleX為視覺模組產品賦能添“智”

NVIDIA擬與印度合作開發AI芯片

NVIDIA Modulus助力風阻預測模型實現

TI (德州儀器) 團隊到訪飛凌嵌入式總部，深化交流與合作

NVIDIA與百度飛槳攜手革新汽車風阻預測:DNNFluid-Car模型的崛起

百度發布文心大模型4.0 Turbo與飛槳框架3.0,引領AI技術新篇章

NVIDIA與Google DeepMind合作推動大語言模型創新

科大訊飛與華中師范大學合作大模型賦能教育

技術團隊們合作開發低溫電路