CPU 的浮點(diǎn)運(yùn)算能力比 GPU 差，為什么不提高 CPU 的浮點(diǎn)運(yùn)算能力呢

問(wèn)：為什么 CPU 的浮點(diǎn)運(yùn)算能力比 GPU 差，為什么不提高 CPU 的浮點(diǎn)運(yùn)算能力？

「速度區(qū)別主要是來(lái)自于架構(gòu)上的區(qū)別」是一個(gè)表面化的解釋。對(duì)，架構(gòu)是不同。但是這種不同是目前各個(gè)廠家選擇的現(xiàn)狀，還是由于本質(zhì)的原因決定的？CPU 能不能增加核？GPU 那張圖為什么不需要 cache？

首先，CPU 能不能像 GPU 那樣去掉 cache？不行。GPU 能去掉 cache 關(guān)鍵在于兩個(gè)因素：數(shù)據(jù)的特殊性（高度對(duì)齊，pipeline 處理，不符合局部化假設(shè)，很少回寫(xiě)數(shù)據(jù)）、高速度的總線。對(duì)于后一個(gè)問(wèn)題，CPU 受制于落后的數(shù)據(jù)總線標(biāo)準(zhǔn)，理論上這是可以改觀的。對(duì)于前一個(gè)問(wèn)題，從理論上就很難解決。因?yàn)?CPU 要提供通用性，就不能限制處理數(shù)據(jù)的種類。這也是 GPGPU 永遠(yuǎn)無(wú)法取代 CPU 的原因。

其次，CPU 能不能增加很多核？不行。首先 cache 占掉了面積。其次，CPU 為了維護(hù) cache 的一致性，要增加每個(gè)核的復(fù)雜度。還有，為了更好的利用 cache 和處理非對(duì)齊以及需要大量回寫(xiě)的數(shù)據(jù)，CPU 需要復(fù)雜的優(yōu)化（分支預(yù)測(cè)、out-of-order 執(zhí)行、以及部分模擬 GPU 的 vectorization 指令和長(zhǎng)流水線）。所以一個(gè) CPU 核的復(fù)雜度要比 GPU 高的多，進(jìn)而成本就更高（并不是說(shuō)蝕刻的成本高，而是復(fù)雜度降低了成片率，所以最終成本會(huì)高）。所以 CPU 不能像 GPU 那樣增加核。

至于控制能力，GPU 的現(xiàn)狀是差于 CPU，但是并不是本質(zhì)問(wèn)題。而像遞歸這樣的控制，并不適合高度對(duì)齊和 pipeline 處理的數(shù)據(jù)，本質(zhì)上還是數(shù)據(jù)問(wèn)題。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴