NVIDIA GPU計算的關鍵技術解析 - 全文

　　1999年，NVIDIA推出了首款圖形處理器(GPU)，它是迄今為止使用最廣的并行處理器。源于對逼真及實時圖像的渴求，GPU已成為既可以浮點運算又可以編程的處理器;如今的GPU在計算吞吐量和內存帶寬上遠優于CPU，使其成為加速數據并行應用程序的理想處理器。

　　2003年起，NVIDIA開始對GPU進行非圖形應用程序方面的探索。通過使用高級圖形語言如DirectX、OpenGL和Cg，將各種數據并行算法移植于GPU。像蛋白質折疊、股票期權定價、SQL查詢及MRI重建等問題都能通過GPU獲得非凡的加速表現。這些早期將圖形API用于通用計算的嘗試被我們稱為GPGPU程序。

　　雖然GPGPU模型顯示出不俗的加速性能，但依舊面臨諸多問題。首先，它要求程序員具備有關圖形API以及GPU架構的相關知識。其次，問題必須按照頂點坐標、紋理及著色程序的方式表達出來，極大地增加了程序的復雜性。第三，不支持諸如隨機讀寫內存等基礎的編程特性，大大限制了編程模型。最后，缺少對雙精度運算的支持(直到最近)意味著有些科學應用程序不能運行在GPU上。

　　為解決這些問題，NVIDIA采用了兩項關鍵技術——G80統一圖形與計算架構(最先采用于GeForce 8800、Quadro FX 5600與Tesla C870 GPU)和CUDA。CUDA作為一種軟硬件架構，可采用多種高級編程語言對GPU進行編程。同時，這兩種技術也代表著一種新的GPU應用方式。相比以前通過編程將專業圖形單元與圖形API結合不同，程序員可通過CUDA擴展來編寫C語言程序，針對通用的大規模并行處理器。我們把這種新型GPU編程模式稱之為“GPU計算”，它意味著更廣泛的應用程序支持，更多編程語言的支持，是與初期GPGPU編程模型的本質分離。

　　G80架構

　　NVIDIA旗下GeForce 8800是被賦予了新型GPU計算模型的產品。2006年11月推出，基于GeForce 8800的G80為GPU計算所帶來了的是一些關鍵性的創新：

　　G80是首款支持C語言的GPU，允許程序員使用GPU所帶來的計算力，而又無須再學習一門新的編程語言。

　　G80是首款以單個、統一處理器取代頂點與像素管線的GPU，這種處理器可以執行頂點、幾何、像素及計算程序。

　　G80是首款利用標量線程處理器的GPU，從而消除了程序員手動管理向量寄存器。

　　G80采用了單指令、多線程(SIMT)的執行模型，多個相互獨立的線程可并行執行單條指令。

　　G80對內部線程通訊采用了共享內存和柵障同步。

　　2008年6月，NVIDIA對G80架構進行了重大改進。第二代統一架構——GT200(首次采用是在GeForce GTX 280，Quadro FX5800 和Tesla T10 GPU上)——將流處理器的核心數量(以下稱其為 CUDA核心)從128增加至240。每個處理器的寄存器組都擴大了一倍，允許更多的線程任何時候在芯片上執行。增加硬件內存的聯合存取以改善內存訪問效率。另外，還添加了對雙精度浮點運算的支持，以處理科學和高性能計算(HPC)應用。

　　在設計每款新一代GPU時，NVIDIA都以改善現有應用性能與GPU可編程性為宗旨;更快速的應用性將能帶來直接的效益，GPU在可編程性上的不斷進步，使得它發展成為我們當下最通用的并行處理器。正是基于這樣的理念，促使我們又著手研發GT200架構的繼任者。

　　NVIDIA的下一代CUDA計算與圖形框架Fermi

　　從最初的G80起，Fermi架構在GPU架構上做出了最重大的飛躍。G80是統一圖形與計算并行處理器的雛形，而GT200是對G80在性能及功能性方面的延伸。對于Fermi，我們融入了上兩款處理器以及為它們編寫應用程序中所獲得的經驗，應用了一種全新的方法，設計和創造出世界上第一款計算型GPU。在Fermi的研發準備過程中，我們收集了自推出G80和GT200以來廣泛使用GPU計算的用戶的反饋，并將以下關鍵領域作為改進重點：

　　改善雙精度浮點運算的性能——單精度的性能大約是臺式CPU的10倍，而有些GPU計算應用程序還需要更高的雙精度浮點運算性能。

　　ECC支持——ECC允許GPU計算用戶在數據中心的安裝中安全地部署大規模的GPU，并確保數據敏感型應用程序，如醫學影像及財務期權定價等不出現內存錯誤。

　　真正的緩存層次——有些并行算法無法使用GPU的共享內存，用戶需要一個真正的緩存架構來輔助他們。

　　更大的共享內存——許多CUDA程序員需要超過16KB的SM共享內存來加速他們的應用程序。

　　更快速的上下文轉換——用戶需要在應用程序之間實現更快速的上下文切換，和圖形與計算應用之間更快速的相互操作。

　　更快速的原子操作——用戶需要為他們的并行算法實現更快速的“讀-修改-寫”原子操作。

　　針對這些需求，Fermi工作小組設計了一款處理器，原始計算力得到了極大的提升，通過架構上的創新還大大增加了可編程性以及計算效率。Fermi在架構上的閃光點體現在：

　　第三代流式多處理器(SM)

　　每個SM有32個CUDA核心，是GT200的4倍

　　雙精度浮點運算的峰值性能是GT200的8倍

　　雙Warp調度器同時調度和分配來自兩個不同warp的指令

　　64 KB的RAM，可配置為共享存儲器和L1緩存

　　第二代并行線程執行ISA

　　統一尋址空間，提供完整的C++支持

　　優化OpenCL和DirectCompute

　　完整的IEEE 754-2008 32-bit和64-bit精度支持

　　完整的32-bit整數路徑，以及64-bit擴展

　　內存存取指令支持向64-bit尋址的轉換

　　通過Predication提升性能

　　改進的內存子系統

　　NVIDIA Parallel DataCacheTM層次，擁有可配置的L1和統一的L2緩存

　　首款提供ECC內存支持的GPU

　　顯著改善原子內存操作性能

　　NVIDIA GigaThreadTM Engine

　　相比早先產品10倍以上的應用程序上下文切換

　　同步執行多核心程序

　　線程塊亂序執行

　　雙重疊式內存傳輸引擎

閱讀全文

上一頁 1 2全文

本文導航

第 1 頁：NVIDIA GPU計算的關鍵技術解析
第 2 頁：下一代CUDA計算與圖形框架Fermi

NVIDIA(101457) NVIDIA(101457)
gpu(126253) gpu(126253)

4G移動通信關鍵技術及特征是什么？

4G移動通信關鍵技術及特征是什么？

2021-05-26 06:37:46

4G移動通信是什么？4G中有哪些關鍵技術？

4G移動通信是什么？4G中有哪些關鍵技術？

2021-05-27 06:17:27

4G移動通信系統的主要特點和關鍵技術有哪些？

4G移動通信系統的主要特點是什么？4G移動通信系統的關鍵技術有哪些？

2021-05-27 06:51:33

5G關鍵技術從Massive MIMO開始

2021-05-21 06:03:25

5G承載網到底有哪些關鍵技術？

5G承載網的整體分層結構5G承載網關鍵技術

2021-03-02 06:23:25

NVIDIA Tesla K20C K20M K20X 并行計算GPU

``提供個人超級計算機解決方案　　高性能GPU運算服務器解決方案/集群解決方案　　Nvidia Tesla C2050 CUDA核心頻率：1.15 GHz CUDA核心數量：448　　雙精度浮點性能

2014-08-03 18:09:13

NVIDIA Tesla K20C K20M 高精密并行計算GPU

`Nvidia TeslaK10GPU 的數量和類型:2 Kepler GK104sCUDA核心數量：3072(每顆 GPU 1536 個)雙精度浮點性能：190 Gigaflops(每顆 GPU

2015-02-05 16:14:28

NVIDIA Tesla K40C K40M 高精密并行計算GPU

&quot; 14000 一年質保工業包裝現貨 Nvidia TeslaK10 &quot;GPU 的數量和類型:2 Kepler GK104sCUDA核心

2014-09-02 21:17:41

NVIDIA Tesla K80 全球最快并行計算GPU 盒包正品、質保三年

Nvidia TeslaK10GPU 的數量和類型:2 Kepler GK104sCUDA核心數量：3072(每顆 GPU 1536 個)雙精度浮點性能：190 Gigaflops(每顆 GPU

2015-01-19 16:53:59

NVIDIA-SMI：監控GPU的絕佳起點

nvidia-smi可執行文件位于虛擬機管理程序上。如果在同一部署中您選擇在GPU上使用作為傳遞，那么GPU正在尋找訪客上的NVIDIA驅動程序，因此nvidia-smi位于訪客上。以上來自于谷歌翻譯以下為原文

2018-09-04 15:18:02

NVIDIA火熱招聘GPU高性能計算架構師

這邊是NVIDIA HR Allen, 我們目前在上海招聘GPU高性能計算架構師(功能驗證)的崗位，有意向的朋友歡迎發送簡歷到 allelin@nvidia

2017-09-01 17:22:28

NVIDIA網格GPU-PSOD的支持結構

they blamed it on the nvidia gpu but they dont know if its a driver or hardware issue.Can a ticket be open

2018-10-10 16:15:55

Nvidia GPU風扇和電源顯示ERR怎么解決

問題最近在Ubuntu上使用Nvidia GPU訓練模型的時候，如果機器鎖屏一段時間再打開的時候鼠標非常卡頓，或者說顯示界面非常卡頓，使用nvidia-smi查看發現，訓練模型的GPU沒有問題，但是

2021-12-30 06:44:30

ASON網絡關鍵技術有哪些？

ASON光網絡由哪幾部分組成？ASON網絡關鍵技術有哪些？ASON的亮點是什么？

2021-05-28 06:48:08

CDMA原理與關鍵技術

CDMA原理與關鍵技術

2012-08-16 20:25:45

CatM的關鍵技術有哪些？CatNB和CatM有什么區別？

物聯網市場的網絡特性是什么？CatNB和CatM有什么區別？CatM的關鍵技術有哪些？

2021-06-30 08:02:29

DDRx的關鍵技術介紹（中）

在DDRx里面經常會被一些縮寫誤擾，如OCD、OCT和ODT，我想有同樣困擾的大有人在，今天還是繼續上一篇的關鍵技術來介紹一下大家的這些困擾吧。片外驅動調校OCD（Off-Chip Driver

2016-08-31 11:36:41

GPS芯片的關鍵技術是什么

談到GPS芯片主要關鍵技術，這包括負責訊號處理─基頻（Baseband）及接收訊號─射頻（RF）。由于GPS訊號頻率（1,575.42MHz）來自于距離地面2萬公里的高空，訊號十分不穩定，因此當天

2019-07-30 06:52:50

LCD顯示的關鍵技術

可以用硬件電路或軟件程序實現B．只能用濾波電路或雙穩態電路實現C．只能用軟件程序實現D．只能用延時程序實現2.LCD顯示的關鍵技術是解決驅動問題，正確的作法是(D)。A．采用固定的交流電壓驅動B．采用直流電...

2021-09-10 08:39:03

LTE-Advanced的關鍵技術和標準進展介紹

）等關鍵技術，能大大提高無線通信系統的峰值數據速率、峰值譜效率、小區平均譜效率以及小區邊界用戶性能，同時也能提高整個網絡的組網效率，這使得LTE和LTE-A系統成為未來幾年內無線通信發展的主流，本文將對這些關鍵技術及其標準進展進行介紹。

2019-06-14 06:41:50

MIMO-OFDM中有哪些關鍵技術？

本文介紹了MIMO-OFDM技術中的關鍵技術，如信道估計、同步、分集技術和空時編碼等。

2021-05-27 06:05:59

McWiLL系統的關鍵技術/優勢及應用

McWiLL系統概述McWiLL系統的關鍵技術McWiLL系統的優勢McWiLL系統的應用

2020-11-24 06:57:16

POE供電的技術優勢和關鍵技術

什么是POE供電？POE供電的技術優勢和拓展應用POE以太網供電的關鍵技術

2020-12-24 07:00:59

POE的關鍵技術有哪些？

使用以太網線供電的優勢是什么？PoE設備是怎么供電的？POE的關鍵技術有哪些？

2021-06-10 09:26:50

RS485轉以太網的應用是什么？有哪些關鍵技術？

RS485轉以太網的應用是什么？RS485轉以太網的解決方案是什么？RS485轉以太網有哪些關鍵技術？

2021-05-27 06:14:04

VR一體機技術的關鍵技術

支持? HDMI、3路MIPI CSI、雙路MIPI DSI等眾多豐富的接口擴展圖2 基于業界領先處理器的核心計算模塊圖3 Qaulcomm 一體機產品四.關鍵技術介紹：1.視覺：1.1.畸變矯正，色散

2018-09-21 10:51:27

WCDMA中的關鍵技術在網絡規劃中的應用是什么

WCDMA中的關鍵技術在網絡規劃中的應用是什么

2021-05-27 06:15:01

【技術系列】淺談GPU虛擬化技術（第一章）

摘要： GPU深度好文系列，阿里云技術專家分享第一章GPU虛擬化發展史GPU的虛擬化發展歷程事實上與公有云市場和云計算應用場景的普及息息相關。如果在10年前談起云計算，大部分人的反應是“不知所云

2018-04-16 10:51:32

【視頻】智能家居系統關鍵技術分析與應用

視頻主題：智能家居系統關鍵技術分析與應用視頻主講：易老師，華清遠見金牌講師。視頻簡介：主講：易老師，華清遠見金牌講師。課程內容：1 智能家居起源及概念；2 智能家居應用現狀；3 智能家居與物聯網

2016-02-26 10:50:43

二三層橋接為何是LTE承載的關鍵技術？

二三層橋接為何是LTE承載的關鍵技術？

2021-05-24 07:17:37

云計算關鍵技術及標準化是什么

分析了云計算關鍵的技術，包括虛擬化/分布式文件系統/分布式數據庫等，介紹了相關云方案實現，并對云計算在IETF/ITU等標準組織的最新研究競爭做了說明。

2021-06-07 06:50:19

什么是5G高頻關鍵技術？

5G技術方興未艾，各種候選技術獲得業界的廣泛關注。本文結合高頻技術在5G中的應用場景和關鍵技術，介紹了愛立信開發的5G高頻無線空口測試床，分享了在中國5G技術研發試驗第一階段的測試結果，分析并總結了5G高頻技術的出色表現。

2019-08-16 07:27:48

什么是HarmonyOS？鴻蒙OS架構及關鍵技術是什么？

什么是HarmonyOS？鴻蒙OS架構及關鍵技術是什么？

2021-09-23 09:02:48

利用CAN總線構建一個車內網絡，需要解決的關鍵技術問題有哪些？

CAN-BUS系統主要包括哪些部件？車載網絡的應用分類有哪幾種？利用CAN總線構建一個車內網絡，需要解決的關鍵技術問題有哪些？

2021-05-13 06:07:54

印制電路板制造的關鍵技術有哪些

`請問印制電路板制造的關鍵技術有哪些？`

2020-01-13 16:30:35

在Ubuntu上使用Nvidia GPU訓練模型

問題最近在Ubuntu上使用Nvidia GPU訓練模型的時候，沒有問題，過一會再訓練出現非常卡頓，使用nvidia-smi查看發現，顯示GPU的風扇和電源報錯：解決方案自動風扇控制在nvidia

2022-01-03 08:24:09

基于嵌入式視頻的多媒體集控系統實現的關鍵技術是什么？

基于嵌入式視頻的多媒體集控系統實現的體系結構基于嵌入式視頻的多媒體集控系統實現的關鍵技術

2021-06-04 07:15:37

多核DSP關鍵技術及其應用有哪些？

多核DSP關鍵技術有哪些？多核DSP的應用有哪些？主流多核DSP介紹

2021-04-21 06:10:10

嵌入式實時系統的關鍵技術是什么？

作為嶄新的、面向應用的計算機系統，嵌入式系統在集成了通用計算機系統的共性以外，還包含了很多適合“嵌入式”應用的新技術;因為在技術上與通用計算機系統有很多不同，本文首先介紹嵌入式系統的基本概念及其關鍵技術，并結合在通信系統中的應用說明其技術特點及可應用性。

2019-08-14 07:43:34

嵌入式系統關鍵技術分析與開發應用

嵌入式系統關鍵技術分析與開發應用

2012-08-09 00:29:48

工業物聯網是如何定義的？工業物聯網的關鍵技術主要包含哪幾個方面？

工業物聯網是如何定義的？工業物聯網的關鍵技術主要包含哪幾個方面？物聯網的工業應用主要在哪些方面？

2021-06-16 07:55:10

數字家庭網絡的關鍵技術是什么？

數字家庭網絡提供的業務類別以及需求有哪些？數字家庭網絡的關鍵技術是什么？

2021-05-26 06:20:16

新一代視頻編碼標準H,264/AVC有哪幾種關鍵技術？

新一代視頻編碼標準H,264/AVC有哪幾種關鍵技術？

2021-06-03 06:33:58

無人駕駛分級及關鍵技術

無人駕駛分級無人駕駛汽車關鍵技術

2021-01-21 07:13:47

無人駕駛汽車的關鍵技術是什么？

無人駕駛汽車開發的關鍵技術主要有兩個方面:車輛定位和車輛控制技術。這兩方面相輔相成共同構成無人駕駛汽車的基礎。

2020-03-18 09:02:01

明白VPP關鍵技術有哪些

隨著人工智能技術的不斷發展，越來越多的行業開始使用人工智能技術，這也使得智能虛擬代理技術得到了廣泛的應用。為了能夠深入了解智能虛擬代理技術，需要明白VPP關鍵技術有哪些。深入了解VPP關鍵技術有

2021-08-31 07:28:16

智能導航系統建設意義是什么？關鍵技術有哪些？

智能導航系統建設意義是什么？智能導航系統中的關鍵技術有哪些？智能導航系統在CDMA無線數據中的應用是什么？

2021-05-27 06:57:38

智能穿戴產業的五大關鍵技術

個過程中，有五大關鍵技術將決定著智能穿戴產業發展的進程和方向。一、人機交互技術在物聯網時代，當人成為“萬物”控制的中心時，人“機”之間的“溝通”方式也將隨即發生變化。著眼于直接、便捷的交互相求，一種

2019-05-09 06:20:34

智能網聯汽車的關鍵技術

2021-07-27 06:31:46

智能通信終端有哪些關鍵技術？

智能通信終端有哪些關鍵技術？

2021-05-26 07:04:20

汽車總線及其關鍵技術的研究

汽車總線及其關鍵技術的研究

2012-07-10 11:33:28

物聯網關鍵技術及其發展

物聯網關鍵技術及其發展

2012-08-14 00:19:20

物聯網的關鍵技術有哪些

物聯網關鍵技術————傳感器技術

2020-06-16 17:25:07

物聯網網關是什么？物聯網網關關鍵技術有哪些？

物聯網網關是什么？物聯網網關的形態物聯網網關關鍵技術有哪些？物聯網網關應用方向及實例

2021-04-19 10:03:11

直升機衛星通信系統關鍵技術有哪些？

本文從直升機衛星通信系統的關鍵技術入手，結合工程應用把問題一一展開。通過對系統全面的了解，對關鍵技術的確認，從而實現對系統的準確測試。

2021-05-21 06:48:52

第四代移動通信系統有哪些關鍵技術？

第四代移動通信技術是什么？有什么主要特點？第四代移動通信系統有哪些關鍵技術？

2021-05-26 07:07:28

視覺導航關鍵技術及應用

由于視覺導航技術的應用越來越普及 ,因此 ,有必要對視覺導航中的關鍵技術及應用進行研究。文章對其中的圖像處理技術和定位與跟蹤技術進行了詳細研究 ,并與此相對應 ,介紹的相關的應用。

2023-09-25 08:09:38

讓機器人實現智能的關鍵技術到底是什么？

讓機器人實現智能的關鍵技術到底是什么？這些技術在最近十年會發展到什么程度？整個產業的應用前景將會如何？

2021-07-05 06:55:38

設計高穩定行運算放大器電路的關鍵技術有哪些？

設計高穩定行運算放大器電路的關鍵技術常用的穩定運算放大電路方法

2021-04-06 06:56:37

詳解5G的六大關鍵技術

過程中會遇到哪些問題？在5G研發剛起步的情況下，如何建立一套全面的5G關鍵技術評估指標體系和評估方法，實現客觀有效的第三方評估，服務技術與資源管理的發展需要，同樣是當前5G技術發展所面臨的重要問題

2017-12-07 18:40:58

請問一下LTE有哪些關鍵技術？

LTE有哪些關鍵技術？

2021-05-21 06:14:07

購買哪款Nvidia GPU

。Nvidia的NV 24核，224 GB RAM，1.4 GB臨時存儲。這是相當昂貴的（每月費用超過3,400美元），除非我承諾1年或3年的承諾，略有減少。我認為如果我購買GPU服務器，從長遠來看可能會更便

2018-09-26 15:30:46

超寬帶認知無線電的關鍵技術是什么？

本文從超寬帶認知無線電適配信號的產生、功率傳輸控制和分布式節點間的合作三個方面，對當前該技術領域的關鍵技術進行了詳細的介紹和分析。

2021-05-26 06:51:23

車載移動異構無線網絡架構及關鍵技術是什么？

車載移動異構無線網絡架構及關鍵技術是什么？

2021-06-07 06:29:57

鯤鵬920芯片是布局云端計算的關鍵技術

華為推出鯤鵬920芯片：布局云端計算的關鍵技術之一

2021-01-25 07:05:35

泰爾實驗室：HSPA關鍵技術解析

泰爾實驗室：HSPA關鍵技術解析 HSPA的全稱為高速分組接入(high speed packet access)，它是高速下行分組接入HSDPA(high speed do

2009-06-01 18:39:56

1368

PCB抄板軟件之POWERPCB關鍵技術解析

PCB抄板軟件之POWERPCB關鍵技術解析在PCB抄板領域，傳統的抄板還是選用PROTEL99作為抄板軟件，但是，隨著電路板技術的不斷升級，電路板密度越來越高、越來越復

2010-01-23 11:34:08

1159

工業以太網協議與應用關鍵技術

本文介紹Ethernet應用于工業現場的幾種關鍵技術與注意事項，工業以太網相關協議解析、工業以太網技術優勢。

2012-12-17 11:25:17

2008

云計算關鍵技術與研究問題

本文為你介紹部分具有挑戰性云計算關鍵技術及其研究問題，具體包括如，虛擬機遷移、服務器整合、能耗管理、流量管理與分析、MapReduce軟件框架、存儲技術、數據管理等多個方面。

2013-01-29 15:19:56

921

云計算的體系結構域關鍵技術_李凌霞

云計算的體系結構域關鍵技術_李凌霞

2017-03-20 09:21:51

NVIDIA GPU加速計算之路

NVIDIA從提出GPU以及CUDA核心開始，NVIDIA便開始逐步邁出游戲圈，不斷向全新的計算領域發起攻勢。時至今日，NVIDIA GPU計算從機器人、自動駕駛，一路擴展到云計算、醫療甚至是NASA火星登錄計劃。

2019-12-23 09:12:33

6930

NVIDIA介紹NVIDIA Ampere架構的NVIDIA A100 GPU技術

兼首席執行官黃仁勛在其加州住宅的廚房中錄制的六集同時發布的主題演講中，介紹了NVIDIA最近對Mellanox的收購，還有重盼所歸的基于NVIDIA Ampere GPU架構的新產品以及重要的最新軟件技術。這場主題演講原計劃于3月底在圣何塞舉行的NVIDIA GPU技術大會上現場直播，但因冠狀病

2020-10-08 00:56:00

4871

NVIDIA GPU加快深度神經網絡訓練和推斷

深度學習是推動當前人工智能大趨勢的關鍵技術。在 MATLAB 中可以實現深度學習的數據準備、網絡設計、訓練和部署全流程開發和應用。聯合高性能 NVIDIA GPU 加快深度神經網絡訓練和推斷。

2022-02-18 13:31:44

1714

已全部加載完成

搜索歷史

NVIDIA GPU計算的關鍵技術解析 - 全文

本文導航

評論