亚洲欧美国产日韩制服 bt,亚洲图片一区二区三区,无限资源日本免费2018

在評估 GPU 性能時，通常首先考察三個指標：圖形工作負載的紋理率（GPixel/s）、浮點運算次數（FLOPS）以及它們能處理計算和AI工作負載的每秒 8-bit tera 運算次數（TOPS）。這些關鍵數據，結合面積數據、功耗估算和通用功能集，幫助 SoC 設計師比較不同系統配置的性能。

然而，這些指標僅提供了理論性能，并不總是能夠很好地反映實際性能。沒有任何 GPU 能夠始終以100%的利用率運行，因此下一步是探索GPU在實際應用中的特定工作負載性能，通常以每秒幀數（FPS）來衡量，并考慮整體GPU利用率。像Manhattan和Aztec這樣的基準測試為實際圖形性能提供了一個有用的指南（盡管它們本身并不能完全代表典型的應用程序）。

通常在這個階段，不同的GPU架構會產生令人驚訝的結果。那些更擅長將理論性能轉化為實際性能的架構會脫穎而出，提供遠高于其標稱TFLOPS預期的幀率（FPS）。

為什么FPS/TFLOPS很重要？通常來說，具有更高TFLOPS的GPU需要更大的硅片面積和更高的功耗。如果一個較小的GPU能夠提供與理論上更強大的GPU相同的實際性能，設計師就需要選擇：要么以更低的成本提供相同的性能，要么保持成本不變但將額外的性能或效率交給最終用戶。基于此，理解GPU的性能效率是了解GPU在終端設備中表現的重要部分。Imagination 的 PowerVR 架構經過數十年的優化，已成為市場上性能最為高效的嵌入式 GPU IP。本文將概述關鍵的硬件和軟件優化，幫助 Imagination 的 GPU 實現比競爭對手的嵌入式產品高出兩倍的 FPS/TFLOPS 性能。

1. 大容量、響應迅速的寄存器存儲

Imagination GPU 的每個算術邏輯單元（ALU）內都有非常大的寄存器存儲，一般為 512KB，通常是競爭對手嵌入式 GPU 設計的兩倍。這使得工作負載可以避免從主GPU內存進行長時間的加載/存儲操作，這些操作可能會延遲處理工作，從而對GPU利用率和效率產生負面影響。ALU中的寄存器體設計得允許同時訪問多個寄存器。這意味著在每個周期中，ALU內的多個單元都可以執行任務。例如，FP32操作可以與復雜操作并行處理，而無需排隊等待內存訪問。大多數其他嵌入式GPU架構在寄存器訪問方面存在限制，這會導致數據需要額外的周期來獲取，從而造成處理停滯。

Imagination GPU設計可同時處理多個工作負載。這意味著當需要進行加載/存儲時，可以通過替代操作填補處理暫停，從而有效避免延遲問題。

2.專用模塊卸載主ALU工作

Imagination 的ALU包含多個固定功能塊，使 GPU 能夠將冗長的任務（如地址計算）從主ALU 卸載，從而使它們可以自由處理一般工作負載。相比之下，大多數其他嵌入式 GPU 提供商通過 INT32 ALU模擬地址計算和復雜任務，降低了整體 GPU 性能效率。

3. 整體 GPU 架構效率

由于其延遲渲染技術，PowerVR架構自問世以來一直是GPU效率的領導者。在流水線的早期階段，Imagination GPU 會全面分析每一幀，確定哪些片段是可見的，并僅處理用戶可以看到的部分。通過盡早移除不必要的操作，Imagination GPU降低了功耗并提高了性能效率。其他嵌入式GPU架構仍然處理比必要更多的片段，浪費寶貴的計算資源和帶寬，從而需要更多功耗。

4. 軟件最大化GPU利用率雖然我們主要從圖形角度討論性能效率，但上述內容同樣適用于計算和 AI 應用。為了進一步提高 AI 工作負載的性能效率，Imagination 提供了一套高度優化的計算庫（imgNN、imgBLAS、imgFFT），用于常見的運算操作，使程序員能夠最大化 GPU 利用率。

所有這些特性的結果不言而喻。在下圖的所有圖形工作負載中，Imagination GPU 的 FPS/TFLOPS超過了同等面積的嵌入式競爭對手設計。在某些情況下，性能效率是其他GPU的兩倍。

圖注：基于Imagination內部數據。所有競爭設備以低時鐘頻率運行，以避免主機 CPU 和系統瓶頸，以便更純粹地了解競爭 GPU 的能力。
GPU性能在所有細分市場上都在蓬勃發展，不僅用于圖形體驗，在 AI 時代，還將其用作靈活的并行計算處理器。硬件設計師有兩種選擇來提供這種額外的性能：一種是簡單地構建一個具有更高理論TFLOPS的GPU；另一種選擇是選擇一個理論TFLOPS較低但高性能效率的 GPU。

聲明：本文為原創文章，轉載需注明作者、出處及原文鏈接。

原文鏈接：https://blog.imaginationtech.com/why-gpu-performance-efficiency-beats-peak-performance

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

嵌入式

嵌入式

+關注

關注
5105

文章
19288

瀏覽量
310171
gpu

gpu

+關注

關注
28

文章
4832

瀏覽量
129794

NVIDIA下一代7nm GPU效率比Turing高兩倍

為Ampere的Turing GPU架構的繼任者將是圖形行業的一項重大交易，它將在總體性能和效率上實現比預期更大的性能飛躍。該報告再次指出A

發表于 01-06 01:56 ?5216次閱讀

優化任何GPU工作負載的峰值性能分析方法

弄清楚如何在個人電腦上降低渲染應用程序的GPU幀時間可能是一項具有挑戰性的任務，即使是最有經驗的PC游戲開發人員也是如此。本博客文章描述了我們在NVIDIA內部使用的性能分類方法，使用NVIDIA

發表于 05-07 10:10 ?1.8w次閱讀

優化任何<b class='flag-5'>GPU</b>工作負載的<b class='flag-5'>峰值</b><b class='flag-5'>性能</b>分析方法

NVIDIA火熱招聘GPU高性能計算架構師

這邊是NVIDIA HR Allen, 我們目前在上海招聘GPU高性能計算架構師(功能驗證)的崗位，有意向的朋友歡迎發送簡歷到 allelin@nvidia.comWechat

發表于 09-01 17:22

無人機螺旋槳效率的高速電機性能

針對螺旋槳效率的高速電機性能：用于無人機電子速度控制的無傳感器高速磁場定向控制參考設計可以幫助電子速度控制器實現效率上的飛躍，使其速度超過12,000 rpm（>1.2kHz），并且還具

發表于 06-26 09:47

GPU加速XenApp/Windows 2016/Office/IE性能會提高嗎

配置文件來了解3D / GPU / HDX性能。 XenApp服務器運行的是帶有4個vCPU和48GB RAM的Windows Server 2016映像。在性能測試期間，我一直在使用GPU

發表于 09-12 16:24

如何在vGPU環境中優化GPU性能

大家好，我收到了關于如何在vGPU環境中優化GPU性能的兩個請求，并認為這將是我們的GRID論壇上的一個很好的線程，每個人都可以在他們如何微調vGPU環境方面添加他們的經驗。讓我從一些公共資源開始

發表于 09-29 14:18

如何估算FPGA的峰值性能？

嗨，作為博士研究的一部分，我試圖估算FPGA的峰值性能，以便與GPU進行比較。我的計算基于Xilinx共同撰寫的這篇文章https://www.hpcwire.com/2012/04/16

發表于 08-13 09:56

探求NVIDIA GPU極限性能的利器

1、探求 NVIDIA GPU 極限性能的利器　　在通常的 CUDA 編程中，用戶主要通過 CUDA C/C++ 或 python 語言實現 CUDA 功能的調用。在 NVIDIA 對 CUDA C

發表于 10-11 14:35

如何使用iMX8mmini提高GPU性能？

我正在使用 iMX8mmini 并嘗試提高 GPU 性能。使用下面的命令我發現當前 GPU 以 500 MHz 的頻率運行。根據數據表或設備樹節點，GPU 以 800 MHz 的標稱頻

發表于 04-18 07:17

Mali GPU性能分析工具

本文檔描述了馬里GPU性能分析工具2.2版中的已知勘誤表。這是一個貫穿整個產品生命周期的工作文檔，因此，隨著新信息的發現，其內容可能會被修改。本文中包含的信息是ARM有限公司的財產，對錯誤或遺漏

發表于 09-05 07:08

Imagination 和臺積電攜手，共同提升業界領先的 GPU 性能

的 PowerVR GPU 達到下一代性能的新境界。雙方初期的合作已為 PowerVR Series6 GPU 內核提升了 25% 的整體性能，其中部分

發表于 09-11 15:10 ?471次閱讀

英特爾深度學習芯片Lake Crest比GPU性能更強大

近日，Intel展示了旗下用于深度神經網絡計算（Deep Neural Network，DNN）的Lake Crest家族新芯的進展，基于Nervana平臺打造，宣稱可以在同樣晶體管密度的情況下提供比GPU更強大的性能。

發表于 02-06 17:16 ?1217次閱讀

關于“GPU性能的硅前預測”的5個問題

人們都很認可“GPU性能非常關鍵”這一觀點。從2011年到2022年，GPU單卡算力提高了10倍以上，而GDDR/HBM帶寬提高大約2倍以上。對于國產

發表于 09-29 10:30 ?1289次閱讀

GPU高性能服務器配置

GPU高性能服務器作為提升計算速度和效率的關鍵設備，在各大應用場景中發揮著越來越重要的作用。在此，petacloud.ai小編為你介紹GPU

發表于 10-21 10:42 ?443次閱讀

如何提高GPU性能

在當今這個視覺至上的時代，GPU（圖形處理單元）的性能對于游戲玩家、圖形設計師、視頻編輯者以及任何需要進行高強度圖形處理的用戶來說至關重要。GPU不僅是游戲和多媒體應用的心臟，它還在科學計算、深度

發表于 10-27 11:21 ?1372次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

?為什么GPU性能效率比峰值性能更關鍵

評論

NVIDIA下一代7nm GPU效率比Turing高兩倍

優化任何GPU工作負載的峰值性能分析方法

NVIDIA火熱招聘GPU高性能計算架構師

無人機螺旋槳效率的高速電機性能

GPU加速XenApp/Windows 2016/Office/IE性能會提高嗎

如何在vGPU環境中優化GPU性能

如何估算FPGA的峰值性能？

探求NVIDIA GPU極限性能的利器

如何使用iMX8mmini提高GPU性能？

Mali GPU性能分析工具

Imagination 和臺積電攜手，共同提升業界領先的 GPU 性能

英特爾深度學習芯片Lake Crest比GPU性能更強大

關于“GPU性能的硅前預測”的5個問題

GPU高性能服務器配置

如何提高GPU性能

電子發燒友