色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPU和CPU誰最強呢?

馬哥Linux運維 ? 來源:馬哥Linux運維 ? 2023-05-10 10:23 ? 次閱讀

近幾個月,幾乎每個行業的小伙伴都了解到了ChatGPT的可怕能力。你知道么,ChatGPT之所以如此厲害,是因為它用到了幾萬張NVIDA Tesla A100顯卡做AI推理和圖形計算。

本文就簡單分享下GPU的相關內容,歡迎閱讀。

GPU是什么?

GPU的英文全稱Graphics Processing Unit,圖形處理單元。

說直白一點:GPU是一款專門的圖形處理芯片,做圖形渲染、數值分析、金融分析、密碼破解,以及其他數學計算與幾何運算的。GPU可以在PC、工作站、游戲主機、手機、平板等多種智能終端設備上運行。

GPU和顯卡的關系,就像是CPU和主板的關系。前者是顯卡的心臟,后者是主板的心臟。有些小伙伴會把GPU和顯卡當成一個東西,其實還有些差別的,顯卡不僅包括GPU,還有一些顯存、VRM穩壓模塊、MRAM芯片、總線、風扇、外圍設備接口等等。

GPU和CPU誰最強呢?

這個其實不好說,好點的GPU內部的晶體管數量可以超過CPU,CPU的強項是做邏輯運算,GPU的強項是做數學運算和圖形渲染。這就ChatGPT用大量高性能顯卡做AI推理的原因。

接下來,我們做個簡單的對比。

結構組成不同

CPU和GPU都是運算的處理器,在架構組成上都包括3個部分:運算單元ALU、控制單元Control和緩存單元Cache。

但是,三者的組成比例卻相差很大。

在CPU中緩存單元大概占50%,控制單元25%,運算單元25%;

在GPU中緩存單元大概占5%,控制單元5%,運算單元90%。

f971b858-ee7d-11ed-90ce-dac502259ad0.png

結構組成上的巨大差異說明:CPU的運算能力更加均衡,但是不適合做大量的運算;GPU更適合做大量運算。

這倒不是說GPU更牛X,實際上GPU更像是一大群工廠流水線上的工人,適合做大量的簡單運算,很復雜的搞不了。但是簡單的事情做得非常快,比CPU要快得多。

相比GPU,CPU更像是技術專家,可以做復雜的運算,比如邏輯運算、響應用戶請求、網絡通信等。但是因為ALU占比較少、內核少,所以適合做相對少量的復雜運算。

f97fc8ee-ee7d-11ed-90ce-dac502259ad0.png

在CPU里面,大概50%是緩存單元,并且是四級緩存結構;而在GPU中,緩存是一級或者二級的。

CPU性能更加注重線程的性能,在控制部分做的事情較多,這樣做就是為了確保控制指令不能中斷,在浮點計算上功耗少。

相較于CPU,GPU的結構更為簡單,基本上它也只做單精度或雙精度浮點運算。GPU的運算速度更快,吞吐量也更高。

CPU基本上是實時響應,采用多級緩存來保障多個任務的響應速度。

GPU往往采用的是批處理的機制,即:任務先排好隊,挨個處理。

fa2f672c-ee7d-11ed-90ce-dac502259ad0.png

GPU對于圖形處理

我們假設在實時渲染中,一幀1080*720P的圖片,那么這張圖就有大概777600個像素點。如果按照最基本的24幀/秒的幀率計算。1秒鐘就要求計算機處理18662400個,即:1866.24萬個像素點。

這還是高清的情況下,如果是1090*1080、2K、4K甚至8K的視頻渲染,可想而知,這個計算量是何其巨大。尤其是在像游戲這樣的實時渲染場景下,顯然僅僅依靠CPU渲染是會超時的。

實際上,在屏幕中顯示的三維物體都要經過多重的坐標變換,并且物體的表面會受到環境中各種光線的影響,呈現不同的顏色和陰影。這就包括了光線的漫射、折射、透射、散射等。

fa5e68b0-ee7d-11ed-90ce-dac502259ad0.jpg

接下來,我們以英偉達NVIDIA RTX3090 為例,看下GPU是如何進行渲染的。

RTX3090的流式多處理器有10496個,每個內核都有具備整數運算和浮點運算的部分,還有用于在操作數中排隊和收集結果的部分。

所謂流式多處理器可以認為是一個獨立的任務處理單元,也可以認為一顆GPU包含了10496個CPU同時處理各個圖片處理任務。

fa66a96c-ee7d-11ed-90ce-dac502259ad0.png

我們就可以通過算法和程序,對1秒鐘18662400個像素點的整體任務進行切割分片,讓10496顆處理器并行計算。

這樣的話,每個處理器負責大概每秒處理18662400/10496,即1778個像素點的渲染任務就行了。

如下圖所示,在GPU中會劃分為多個流式處理區,每個處理區包含數百個內核,每個內核相當于一顆簡化版的CPU,具備整數運算和浮點運算的功能,以及排隊和結果收集功能。

fa7050ca-ee7d-11ed-90ce-dac502259ad0.png

注意,除了流處理器CUDA以外,影響GPU性能的還有

緩存不同

浮點運算方式不同

響應方式不同

核心頻率:頻率越高,性能越強、功耗也越高。

顯示位寬:單位是bit,位寬決定了顯卡同時可以處理的數據量,越大越好。

顯存容量:顯存容量越大,代表能緩存的數據就越多。

顯存頻率:單位是MHz或bps,顯存頻率越高,圖形數據傳輸速度就越快。

總結

一言以蔽之,GPU不管是處理圖形渲染、數值分析,還是處理AI推理。底層邏輯都是將極為繁重的數學進行任務拆解,化繁為簡。

然后,利用GPU多流處理器的機制,將大量的運算拆解為一個個小的、簡單的運算,并行處理。我們也可以認為一個GPU就是一個集群,里面每個流處理器都是一顆CPU,這樣就容易理解了。

fb1fc564-ee7d-11ed-90ce-dac502259ad0.png

以上是關于GPU概念、工作原理的簡要介紹。說是簡單,其實在圖形處理方面,還有很多深層次的處理邏輯沒有展開,比如像素位置變換、三角原理等等。感興趣的小伙伴可以深入研究下。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4729

    瀏覽量

    128892
  • 主板
    +關注

    關注

    53

    文章

    1875

    瀏覽量

    70770
  • 顯卡
    +關注

    關注

    16

    文章

    2431

    瀏覽量

    67577

原文標題:總結

文章出處:【微信號:magedu-Linux,微信公眾號:馬哥Linux運維】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    CPU內存或GPU內存進行分組方式實戰

    CPU+GPU協同計算中,CPUGPU的計算能力不同,靜態地給CPUGPU劃分任務會導致CPU
    的頭像 發表于 05-03 09:01 ?7142次閱讀
    <b class='flag-5'>CPU</b>內存或<b class='flag-5'>GPU</b>內存進行分組方式實戰

    FPGA比CPUGPU快的原理是什么

    本文首先闡述了FPGA的原理了,其次分析了FPGA比CPUGPU快的原理,最后闡述了CPUGPU的區別。
    的頭像 發表于 05-31 09:00 ?1.7w次閱讀
    FPGA比<b class='flag-5'>CPU</b>和<b class='flag-5'>GPU</b>快的原理是什么

    CPUGPU的Intel可能砍掉最強核顯Iris Pro

    Intel不是GPU公司,但因為旗下的桌面CPU基本上都整合了GPU單元,半賣半送之下Intel坐擁全球最大的GPU份額,而且大部分時間都超過70%,簡直是“壟斷”。2013年隨著Ha
    發表于 09-23 15:08 ?2441次閱讀
    買<b class='flag-5'>CPU</b>送<b class='flag-5'>GPU</b>的Intel可能砍掉<b class='flag-5'>最強</b>核顯Iris Pro

    CPUGPU和內存知識科普

    本文內容包括CPU、內存和GPU知識,本期重點更新GPUCPU部分知識。比如:GPU更新包括架構演進,最新產品A100、選型策略、架構分析
    的頭像 發表于 11-13 11:47 ?1913次閱讀
    <b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>和內存知識科普

    才是CPUGPU融合的領先者?

    如果要評選2011年度的計算機行業最大變革,那么CPUGPU的融合就是當之無愧的頭號熱門。兩大芯片巨頭,無論是AMD還是Intel,都堅定不移地讓CPUGPU兩個原本各自獨立的概念
    發表于 10-14 11:01 ?2185次閱讀
    <b class='flag-5'>誰</b>才是<b class='flag-5'>CPU</b>和<b class='flag-5'>GPU</b>融合的領先者?

    CPU 的浮點運算能力比 GPU 差,為什么不提高 CPU 的浮點運算能力

    為什么 CPU 的浮點運算能力比 GPU 差,為什么不提高 CPU 的浮點運算能力?
    的頭像 發表于 03-16 15:12 ?1.6w次閱讀

    CPU-GPU同步暫停

    使用Intel INDE工具刪除CPU-GPU同步暫停,該暫停導致CPUGPU之間的某些并行性丟失。
    的頭像 發表于 05-31 15:18 ?1562次閱讀

    華為Nova5Pro遇上華為P30Pro后,才是最強的華為旗艦

    隨著華為旗下拍照手機華為Nova5系列的發布,大家對于華為強大的拍照能力又有了一個新認識。此前華為手機中拍照以及綜合性能最強的旗艦是華為P30Pro,那么當華為Nova5Pro遇上華為P30Pro后,才是最強的華為旗艦
    的頭像 發表于 08-14 10:23 ?1.4w次閱讀

    GPUCPU間的比較

    GPUCPU比較,GPU為什么更適合深度學習?
    的頭像 發表于 08-26 15:32 ?4705次閱讀

    CPUGPU的區別有哪些

    CPUGPU的區別有哪些?接下來簡單給大家介紹一下關于GPUCPU的區別。
    的頭像 發表于 01-06 17:07 ?3.1w次閱讀

    gpucpu有什么區別?

    gpucpu有什么區別? GPUCPU是電腦中兩個重要的計算器件。如果想要了解這兩個設備的區別,需要從它們的含義和工作原理入手。 首先,CPU
    的頭像 發表于 08-09 16:15 ?1.3w次閱讀

    什么是GPUCPUGPUCPU的區別及聯系

    GPUCPU是計算機系統中最重要的兩種處理器,它們在不同的應用中發揮不同的作用。
    發表于 08-09 18:24 ?5613次閱讀

    cpu gpu npu的區別 NPU與GPU哪個好?gpu是什么意思?

    cpu gpu npu的區別 NPU與GPU哪個好?gpu是什么意思? 在當今數字化和人工智能的時代,高效的計算能力是現代技術發展的重要基礎。因此,Central Processing
    的頭像 發表于 08-27 17:03 ?1w次閱讀

    為什么GPUCPU更快?

    GPUCPU更快的原因并行處理能力:GPU可以同時處理多個任務和數據,而CPU通常只能一次處理一項任務。這是因為GPU的架構使得它可以同時
    的頭像 發表于 01-26 08:30 ?2396次閱讀
    為什么<b class='flag-5'>GPU</b>比<b class='flag-5'>CPU</b>更快?

    gpu是什么和cpu的區別

    GPUCPU是兩種常見的計算機處理器,它們在結構和功能上有很大的區別。在這篇文章中,我們將探討GPUCPU的區別,并詳細介紹它們的原理、應用領域和性能特點。 一、概述 1.1
    的頭像 發表于 02-20 11:24 ?1.9w次閱讀
    主站蜘蛛池模板: chinese黑人第一次| 婷婷综合亚洲爱久久| 免费精品国偷自产在线| 美女漏bb| 欧美美女一区二区三区| 日本人xxxⅹ18hd19hd| 最近2018年手机中文字幕| 最新中文字幕在线视频| 2021全国精品卡一卡二| 亚洲 欧美 制服 视频二区| 欧美の无码国产の无码影院| 黄网13区| 古代荡乳尤物H妓女调教| 影音先锋av电影| 胸大的姑娘中文字幕视频| 欧美一级成人影院免费的| 久久国产成人午夜AV影院无码| 多人乱肉高hnp| jizz丝袜| 1234成人网| 亚洲幼女网| 亚洲 欧美 清纯 校园 另类| 青草精品国产福利在线视频| 口工漫画r18全彩啪啪| 后入到高潮免费观看| 国产精品7777人妻精品冫| www.av色| 99手机在线视频| 11 13加污女qq看他下面| 一级性生活毛片| 亚洲精品视频在线播放| 午夜视频无码国产在线观看| 三级黃60分钟| 日本枯瘦娇小| 青青草干免费线观看| 欧美成人亚洲高清在线观看 | 欧美 亚洲 另类 综合网| 精品亚洲午夜久久久久| 國産麻豆AVMDMD0179| 国产日韩亚洲专区无码| 国产精品大陆在线视频|