色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一文了解CPU、GPU和TPU的區(qū)別

dKBf_eetop_1 ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-09-06 16:53 ? 次閱讀

很多讀者可能分不清楚 CPU、GPU 和 TPU 之間的區(qū)別,因此 Google Cloud 將在這篇博客中簡(jiǎn)要介紹它們之間的區(qū)別,并討論為什么 TPU 能加速深度學(xué)習(xí)。

張量處理單元(TPU)是一種定制化的 ASIC 芯片,它由谷歌從頭設(shè)計(jì),并專(zhuān)門(mén)用于機(jī)器學(xué)習(xí)工作負(fù)載。TPU 為谷歌的主要產(chǎn)品提供了計(jì)算支持,包括翻譯、照片、搜索助理和 Gmail 等。Cloud TPU 將 TPU 作為可擴(kuò)展的云計(jì)算資源,并為所有在 Google Cloud 上運(yùn)行尖端 ML 模型的開(kāi)發(fā)者與數(shù)據(jù)科學(xué)家提供計(jì)算資源。在 Google Next’18 中,我們宣布 TPU v2 現(xiàn)在已經(jīng)得到用戶(hù)的廣泛使用,包括那些免費(fèi)試用用戶(hù),而 TPU v3 目前已經(jīng)發(fā)布了內(nèi)部測(cè)試版。

第三代 Cloud TPU

如上為 tpudemo.com 截圖,該網(wǎng)站 PPT 解釋了 TPU 的特性與定義。在本文中,我們將關(guān)注 TPU 某些特定的屬性。

神經(jīng)網(wǎng)絡(luò)如何運(yùn)算

在我們對(duì)比 CPU、GPU 和 TPU 之前,我們可以先了解到底機(jī)器學(xué)習(xí)或神經(jīng)網(wǎng)絡(luò)需要什么樣的計(jì)算。如下所示,假設(shè)我們使用單層神經(jīng)網(wǎng)絡(luò)識(shí)別手寫(xiě)數(shù)字。

如果圖像為 28×28 像素的灰度圖,那么它可以轉(zhuǎn)化為包含 784 個(gè)元素的向量。神經(jīng)元會(huì)接收所有 784 個(gè)值,并將它們與參數(shù)值(上圖紅線)相乘,因此才能識(shí)別為「8」。其中參數(shù)值的作用類(lèi)似于用「濾波器」從數(shù)據(jù)中抽取特征,因而能計(jì)算輸入圖像與「8」之間的相似性:

這是對(duì)神經(jīng)網(wǎng)絡(luò)做數(shù)據(jù)分類(lèi)最基礎(chǔ)的解釋?zhuān)磳?shù)據(jù)與對(duì)應(yīng)的參數(shù)相乘(上圖兩種顏色的點(diǎn)),并將它們加在一起(上圖右側(cè)收集計(jì)算結(jié)果)。如果我們能得到最高的預(yù)測(cè)值,那么我們會(huì)發(fā)現(xiàn)輸入數(shù)據(jù)與對(duì)應(yīng)參數(shù)非常匹配,這也就最可能是正確的答案。

簡(jiǎn)單而言,神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)和參數(shù)之間需要執(zhí)行大量的乘法和加法。我們通常會(huì)將這些乘法與加法組合為矩陣運(yùn)算,這在我們大學(xué)的線性代數(shù)中會(huì)提到。所以關(guān)鍵點(diǎn)是我們?cè)撊绾慰焖賵?zhí)行大型矩陣運(yùn)算,同時(shí)還需要更小的能耗。

CPU 如何運(yùn)行

因此 CPU 如何來(lái)執(zhí)行這樣的大型矩陣運(yùn)算任務(wù)呢?一般 CPU 是基于馮諾依曼架構(gòu)的通用處理器,這意味著 CPU 與軟件和內(nèi)存的運(yùn)行方式如下:

CPU 如何運(yùn)行:該動(dòng)圖僅展示了概念性原理,并不反映 CPU 的實(shí)際運(yùn)算行為。

CPU 最大的優(yōu)勢(shì)是靈活性。通過(guò)馮諾依曼架構(gòu),我們可以為數(shù)百萬(wàn)的不同應(yīng)用加載任何軟件。我們可以使用 CPU 處理文字、控制火箭引擎、執(zhí)行銀行交易或者使用神經(jīng)網(wǎng)絡(luò)分類(lèi)圖像。

但是,由于 CPU 非常靈活,硬件無(wú)法一直了解下一個(gè)計(jì)算是什么,直到它讀取了軟件的下一個(gè)指令。CPU 必須在內(nèi)部將每次計(jì)算的結(jié)果保存到內(nèi)存中(也被稱(chēng)為寄存器或 L1 緩存)。內(nèi)存訪問(wèn)成為 CPU 架構(gòu)的不足,被稱(chēng)為馮諾依曼瓶頸。雖然神經(jīng)網(wǎng)絡(luò)的大規(guī)模運(yùn)算中的每一步都是完全可預(yù)測(cè)的,每一個(gè) CPU 的算術(shù)邏輯單元(ALU,控制乘法器和加法器的組件)都只能一個(gè)接一個(gè)地執(zhí)行它們,每一次都需要訪問(wèn)內(nèi)存,限制了總體吞吐量,并需要大量的能耗。

GPU 如何工作

為了獲得比 CPU 更高的吞吐量,GPU 使用一種簡(jiǎn)單的策略:在單個(gè)處理器中使用成千上萬(wàn)個(gè) ALU?,F(xiàn)代 GPU 通常在單個(gè)處理器中擁有 2500-5000 個(gè) ALU,意味著你可以同時(shí)執(zhí)行數(shù)千次乘法和加法運(yùn)算。

GPU 如何工作:這個(gè)動(dòng)畫(huà)僅用于概念展示。并不反映真實(shí)處理器的實(shí)際工作方式。

這種 GPU 架構(gòu)在有大量并行化的應(yīng)用中工作得很好,例如在神經(jīng)網(wǎng)絡(luò)中的矩陣乘法。實(shí)際上,相比 CPU,GPU 在深度學(xué)習(xí)的典型訓(xùn)練工作負(fù)載中能實(shí)現(xiàn)高幾個(gè)數(shù)量級(jí)的吞吐量。這正是為什么 GPU 是深度學(xué)習(xí)中最受歡迎的處理器架構(gòu)。

但是,GPU 仍然是一種通用的處理器,必須支持幾百萬(wàn)種不同的應(yīng)用和軟件。這又把我們帶回到了基礎(chǔ)的問(wèn)題,馮諾依曼瓶頸。在每次幾千個(gè) ALU 的計(jì)算中,GPU 都需要訪問(wèn)寄存器或共享內(nèi)存來(lái)讀取和保存中間計(jì)算結(jié)果。因?yàn)?GPU 在其 ALU 上執(zhí)行更多的并行計(jì)算,它也會(huì)成比例地耗費(fèi)更多的能量來(lái)訪問(wèn)內(nèi)存,同時(shí)也因?yàn)閺?fù)雜的線路而增加 GPU 的物理空間占用。

TPU 如何工作

當(dāng)谷歌設(shè)計(jì) TPU 的時(shí)候,我們構(gòu)建了一種領(lǐng)域特定的架構(gòu)。這意味著,我們沒(méi)有設(shè)計(jì)一種通用的處理器,而是專(zhuān)用于神經(jīng)網(wǎng)絡(luò)工作負(fù)載的矩陣處理器。TPU 不能運(yùn)行文本處理軟件、控制火箭引擎或執(zhí)行銀行業(yè)務(wù),但它們可以為神經(jīng)網(wǎng)絡(luò)處理大量的乘法和加法運(yùn)算,同時(shí) TPU 的速度非常快、能耗非常小且物理空間占用也更小。

其主要助因是對(duì)馮諾依曼瓶頸的大幅度簡(jiǎn)化。因?yàn)樵撎幚砥鞯闹饕蝿?wù)是矩陣處理,TPU 的硬件設(shè)計(jì)者知道該運(yùn)算過(guò)程的每個(gè)步驟。因此他們放置了成千上萬(wàn)的乘法器和加法器并將它們直接連接起來(lái),以構(gòu)建那些運(yùn)算符的物理矩陣。這被稱(chēng)作脈動(dòng)陣列(Systolic Array)架構(gòu)。在 Cloud TPU v2 的例子中,有兩個(gè) 128X128 的脈動(dòng)陣列,在單個(gè)處理器中集成了 32768 個(gè) ALU 的 16 位浮點(diǎn)值。

我們來(lái)看看一個(gè)脈動(dòng)陣列如何執(zhí)行神經(jīng)網(wǎng)絡(luò)計(jì)算。首先,TPU 從內(nèi)存加載參數(shù)到乘法器和加法器的矩陣中。

然后,TPU 從內(nèi)存加載數(shù)據(jù)。當(dāng)每個(gè)乘法被執(zhí)行后,其結(jié)果將被傳遞到下一個(gè)乘法器,同時(shí)執(zhí)行加法。因此結(jié)果將是所有數(shù)據(jù)和參數(shù)乘積的和。在大量計(jì)算和數(shù)據(jù)傳遞的整個(gè)過(guò)程中,不需要執(zhí)行任何的內(nèi)存訪問(wèn)。

這就是為什么 TPU 可以在神經(jīng)網(wǎng)絡(luò)運(yùn)算上達(dá)到高計(jì)算吞吐量,同時(shí)能耗和物理空間都很小。

好處:成本降低至 1/5

因此使用 TPU 架構(gòu)的好處就是:降低成本。以下是截至 2018 年 8 月(寫(xiě)這篇文章的時(shí)候)Cloud TPU v2 的使用價(jià)格。

Cloud TPU v2 的價(jià)格,截至 2018 年 8 月。

斯坦福大學(xué)發(fā)布了深度學(xué)習(xí)和推理的基準(zhǔn)套裝 DAWNBench。你可以在上面找到不同的任務(wù)、模型、計(jì)算平臺(tái)以及各自的基準(zhǔn)結(jié)果的組合。

在 DAWNBench 比賽于 2018 年 4 月結(jié)束的時(shí)候,非 TPU 處理器的最低訓(xùn)練成本是 72.40 美元(使用現(xiàn)場(chǎng)實(shí)例訓(xùn)練 ResNet-50 達(dá)到 93% 準(zhǔn)確率)。而使用 Cloud TPU v2 搶占式計(jì)價(jià),你可以在 12.87 美元的價(jià)格完成相同的訓(xùn)練結(jié)果。這僅相當(dāng)于非 TPU 的不到 1/5 的成本。這正是神經(jīng)網(wǎng)絡(luò)領(lǐng)域特定架構(gòu)的威力之所在。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11031

    瀏覽量

    215925
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4909

    瀏覽量

    130628
  • TPU
    TPU
    +關(guān)注

    關(guān)注

    0

    文章

    151

    瀏覽量

    21074

原文標(biāo)題:CPU、GPU 和 TPU 都是如何工作的?有什么區(qū)別?TPU為什能碾壓GPU? 這篇說(shuō)的最清楚!

文章出處:【微信號(hào):eetop-1,微信公眾號(hào):EETOP】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 1人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    理清CPU、GPUTPU的關(guān)系

    很多讀者可能分不清楚 CPUGPUTPU 之間的區(qū)別,因此 Google Cloud 將在這篇博客中簡(jiǎn)要介紹它們之間的區(qū)別,并討論為
    的頭像 發(fā)表于 09-04 11:12 ?4722次閱讀

    CPUGPU再到TPU,Google的AI芯片是如何步步進(jìn)化過(guò)來(lái)的?

    計(jì)算中大量的重復(fù)處理過(guò)程有著天生的優(yōu)勢(shì)。這就好比在畫(huà)幅畫(huà)的時(shí)候CPU是用支筆筆的來(lái)畫(huà),而GPU
    發(fā)表于 03-15 11:40

    GPUCPU區(qū)別是什么

    GPU是如何工作的GPU與DSP區(qū)別GPUCPU區(qū)別是什么
    發(fā)表于 01-05 06:15

    CPU,GPU,TPU,NPU都是什么

    嵌入式算法移植優(yōu)化學(xué)習(xí)筆記5——CPU,GPU,TPU,NPU都是什么、什么是CPU?二、什么是GPU
    發(fā)表于 12-15 06:07

    搞懂 CPUGPUTPU

    張量處理單元(TPU)是種定制化的 ASIC 芯片,它由谷歌從頭設(shè)計(jì),并專(zhuān)門(mén)用于機(jī)器學(xué)習(xí)工作負(fù)載。TPU 為谷歌的主要產(chǎn)品提供了計(jì)算支持,包括翻譯、照片、搜索助理和 Gmail 等。 在本文中,我們將關(guān)注
    的頭像 發(fā)表于 09-15 10:46 ?4.5w次閱讀

    TPUGPU的帶寬模型

    帶寬模型最大的限制就是這些計(jì)算是針對(duì)特定矩陣大小的,計(jì)算的難度在各種尺寸之間都不同。例如,如果你的batch size是128,那么GPU的速度會(huì)比TPU稍快點(diǎn)。如果batch size小于128
    的頭像 發(fā)表于 10-21 09:20 ?4583次閱讀

    CPUGPUTPU是如何工作的到底有什么區(qū)別

    很多讀者可能分不清楚 CPUGPUTPU 之間的區(qū)別,因此 Google Cloud 將在這篇博客中簡(jiǎn)要介紹它們之間的區(qū)別,并討論為
    的頭像 發(fā)表于 01-20 11:57 ?5985次閱讀

    知道CPUGPU區(qū)別

    對(duì)于GPU,大家想必也十分熟悉。但是,大家真的了解GPU嗎?譬如,GPU和顯卡是同個(gè)東西嗎?CPU
    的頭像 發(fā)表于 11-23 10:14 ?6110次閱讀

    GPUCPU有什么區(qū)別GPU的詳細(xì)介紹

    對(duì)于GPU,大家想必也十分熟悉。但是,大家真的了解GPU嗎?譬如,GPU和顯卡是同個(gè)東西嗎?CPU
    的頭像 發(fā)表于 11-28 11:23 ?2.4w次閱讀

    CPU、GPU、TPU、NPU等的講解

    CPU、GPU、TPU、NPU等的講解
    的頭像 發(fā)表于 01-05 14:54 ?1.2w次閱讀

    CPUGPU區(qū)別有哪些

    CPUGPU區(qū)別有哪些呢?接下來(lái)簡(jiǎn)單給大家介紹下關(guān)于GPUCPU
    的頭像 發(fā)表于 01-06 17:07 ?3.2w次閱讀

    什么是CPU、GPU、TPU、DPU、NPU、BPU?有什么區(qū)別

    技術(shù)日新月異,物聯(lián)網(wǎng)、人工智能、深度學(xué)習(xí)等遍地開(kāi)花,各類(lèi)芯片名詞GPU, TPU, NPU,DPU層出不窮…它們都是什么鬼?又有什么不樣? 01 CPU
    的頭像 發(fā)表于 06-30 08:48 ?1.8w次閱讀
    什么是<b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>、<b class='flag-5'>TPU</b>、DPU、NPU、BPU?有什么<b class='flag-5'>區(qū)別</b>?

    gpucpu有什么區(qū)別

    gpucpu有什么區(qū)別? GPUCPU是電腦中兩個(gè)重要的計(jì)算器件。如果想要了解這兩個(gè)設(shè)備的
    的頭像 發(fā)表于 08-09 16:15 ?1.4w次閱讀

    CPUGPUTPU之間有什么區(qū)別?

    CPUGPUTPU之間有什么區(qū)別? CPU(Central Processing Unit,中央處理器)是
    的頭像 發(fā)表于 12-15 10:10 ?7494次閱讀

    gpu是什么和cpu區(qū)別

    GPUCPU是兩種常見(jiàn)的計(jì)算機(jī)處理器,它們?cè)诮Y(jié)構(gòu)和功能上有很大的區(qū)別。在這篇文章中,我們將探討GPUCPU
    的頭像 發(fā)表于 02-20 11:24 ?2w次閱讀
    主站蜘蛛池模板: 美女医生深夜在家裸睡惨死 | 一道本在线伊人蕉无码 | 国产精品人妻午夜福利 | 国产精品99久久久久久人韩国 | 一个人在线观看免费高清视频 | 女人会操出水图 | 国产精品久久久久久AV免费不卡 | 寻找最美乡村教师颁奖晚会 | 亚洲人成在线观看一区二区 | 0855福利| 久久精品电影院 | 中文字幕亚洲欧美在线视频 | 久久re视频这里精品一本到99 | 久久日本精品在线热 | 大胸美女被吊起来解开胸罩 | 处 女 开 破小说 | 18禁止观看免费私人影院 | 久久婷婷五月综合色丁香花 | 怡红院美国分院一区二区 | 欧美日韩中文国产一区发布 | 99久久蜜臀AV免费看蛮 | 十分钟免费视频大全在线 | 精品久久香蕉国产线看观看麻豆 | 婷婷精品国产亚洲AV在线观看 | free乌克兰性xxxxhd | 亚洲日本香蕉视频观看视频 | 羞羞麻豆国产精品1区2区3区 | 一二三四免费中文在线1 | 国内精品九九视频 | 久久热r在线视频精品 | a级毛片黄免费a级毛片 | 少妇系列之白嫩人妻 | 国产精品久久久久久久久99热 | 日本精品在线观看视频 | porono日本xxx | 久久综合给合久久狠狠狠… | 国产女高清在线看免费观看 | 古月娜下面好紧好爽 | 国产成人aaa在线视频免费观看 | 嫩草视频在线观看免费 | 国产精品99久久久久久WWW |

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品