亚洲天堂久,一二三四在线视频社区,天天噜

在HPC應(yīng)用上，對突破性能的追求是從未停歇的，尤其是在人工智能、機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析等新興應(yīng)用提出更高的性能要求后。但制程突破的速度已經(jīng)逐漸放緩，每個(gè)工藝節(jié)點(diǎn)帶來的頻率紅利也在慢慢變小。而為了減少生產(chǎn)和開發(fā)成本，提高良率，不少CPU制造商都開始看向小芯片。 2020年的最后一天，AMD公布了自己在小芯片GPU上的專利，引起了不少熱議。大家都在猜測，小芯片是否能成為后摩爾時(shí)代芯片設(shè)計(jì)創(chuàng)新的利器呢？

AMD：從小芯片CPU走向小芯片GPU

AMD從很早開始就在小芯片上發(fā)力了，不管是EPYC服務(wù)器CPU還是線程撕裂者桌面CPU，都大量運(yùn)用了小芯片設(shè)計(jì)。在AMD看來，傳統(tǒng)的單片處理器將一個(gè)或多個(gè)CPU核心放置在單個(gè)裸片上，以此加速時(shí)鐘頻率和緩存讀取，雖然這種策略對于需要重度CPU使用的工作來說非常合理，但仍有其限制。而小芯片設(shè)計(jì)可以帶來更快的架構(gòu)創(chuàng)新，尤其是在數(shù)據(jù)中心等應(yīng)用上。在去年的ISSCC 2020上，AMD重點(diǎn)提到了小芯片在第二代EPYC服務(wù)器CPU上帶來的優(yōu)勢。運(yùn)用Zen 2架構(gòu)的EPYC服務(wù)器CPU上，AMD在CPU核心上運(yùn)用了臺積電代工的7nm小芯片，IOD仍然采用Global Foundries的14nm制程。AMD提到這種設(shè)計(jì)實(shí)現(xiàn)了更高的核心數(shù)和更高的性能，而且顯著降低了成本。而AMD近期公布的小芯片GPU專利同樣掀起了不小的浪花，該專利展示了一種使用高帶寬交聯(lián)的小芯片GPU設(shè)計(jì)方案。

小芯片GPU / AMD 在該專利中，AMD提到，由于多數(shù)應(yīng)用是以單個(gè)GPU為前提寫就的，所以為了保留現(xiàn)有的應(yīng)用編程模型，將小芯片設(shè)計(jì)實(shí)現(xiàn)在GPU上向來都是一大挑戰(zhàn)。而該專利利用一根總線將第一個(gè)GPU小芯片與CPU相連，余下的GPU用被動交聯(lián)連接。如今許多架構(gòu)至少擁有一級緩存連貫分布在整個(gè)GPU裸片上，比如L3或其他最后一級緩存（LLC）。而這種設(shè)計(jì)中，這些物理資源被放置在不同的裸片上，并提供通信連接以保證其緩存連貫性。在工作過程中，內(nèi)存地址請求從CPU發(fā)往一個(gè)GPU小芯片，后者與高帶寬被動交聯(lián)溝通以定位所需數(shù)據(jù)，因此從CPU的角度來看，仍然是在一個(gè)單獨(dú)的GPU上尋址。

Intel：以小芯片打造客戶2.0的芯片

芯片方案演化 / Intel Intel在去年的架構(gòu)日上給出了他們在IP/SOC上的策略改變，在過去整合的單片SOC中，開發(fā)周期長達(dá)3到4年，而且在投入使用后，制造商和用戶會在芯片上發(fā)現(xiàn)上百個(gè)Bug。而演化至多裸片的基本小芯片結(jié)構(gòu)后，將GPU、CPU和IO放置在不同的裸片上，開發(fā)周期縮減至2-3年，Bug數(shù)目縮減至十?dāng)?shù)個(gè)，不僅如此，小芯片設(shè)計(jì)還可以重復(fù)使用。最后則是Intel對未來小芯片結(jié)構(gòu)的展望，將不同的IP放在最優(yōu)制程的小芯片上，比如內(nèi)存、I/O或圖形等，從IP或小芯片層面上來做驗(yàn)證，因此Bug數(shù)目不足十個(gè)，開發(fā)周期僅需1年。

客戶2.0方案 / Intel 這樣的設(shè)計(jì)也讓Intel對芯片定位有了更多的自由，比如游戲玩家需要更多的圖形性能，而開發(fā)者則更渴求高算力的和強(qiáng)大的AI性能等。這也就是Intel設(shè)想的客戶2.0愿景，通過智能感知帶給消費(fèi)者無縫的高性能體驗(yàn)。盡管GPU一直是Intel的弱項(xiàng)之一，但這并不代表Intel沒有在顯示領(lǐng)域上發(fā)力。自從Intel從AMD的圖形部門挖走首席架構(gòu)師Raja Koduri以來，Intel就開始在獨(dú)立顯卡上發(fā)力。Intel于2019年末公布了超算級別的GPU，代號名為Ponte Vecchio，該GPU基于7nm工藝和小芯片技術(shù)，將于2021年年內(nèi)安裝在Aurora超級計(jì)算機(jī)上作為圖形加速器使用。

小芯片的后盾：新的互聯(lián)與封裝技術(shù)

如果沒有創(chuàng)新的互聯(lián)與封裝技術(shù)，小芯片設(shè)計(jì)同樣是無法立足的。在小芯片的封裝上，Intel已經(jīng)規(guī)劃好了詳細(xì)的封裝路線圖。

處理器封裝路線圖 / Intel 在Kaby Lake G處理器和Agilex FPGA上，Intel已經(jīng)實(shí)現(xiàn)了EMIB這種2.5D的封裝方式。而Intel在Lakefield系列處理器上使用的Foveros 3D封裝技術(shù)則是對EMIB的進(jìn)一步補(bǔ)充，該技術(shù)可將凸起高度進(jìn)一步降低至50-25um，并實(shí)現(xiàn)接近1000 IO/mm2的密度。

Infinity架構(gòu) / AMD 但要想分解后的小芯片也能保持聯(lián)通，這就是互聯(lián)技術(shù)派上用場的地方，比如AMD在Zen架構(gòu)CPU中引入的Infinity Fabric。AMD將Infinity Fabric視為連接各大產(chǎn)品線的基石，通過第三代Infinity框架，AMD得以為CPU與GPU之間提供大帶寬和低延遲的連接、統(tǒng)一的內(nèi)存訪問，提升AMD產(chǎn)品的結(jié)合性能并簡化編程。

小結(jié)

去年的全球硬科技創(chuàng)新大會上，芯動科技、紫光存儲等成立了中國Chiplet產(chǎn)業(yè)聯(lián)盟，推動國內(nèi)的小芯片發(fā)展。芯動科技在2020年推出了國產(chǎn)自主Chiplet標(biāo)準(zhǔn)INNOLINK，讓龐大的數(shù)據(jù)在小芯片之間低延遲傳輸。

INNOLINK解決方案 / 芯動科技至于AMD的小芯片GPU，其實(shí)如此架構(gòu)可能更有可能用于未來的CDNA數(shù)據(jù)中心GPU，而不是下一代RDNA消費(fèi)級GPU。因?yàn)閷τ谙M(fèi)級GPU來說，很大一部分場景是對延遲極度敏感的游戲應(yīng)用，這正是小芯片GPU必須要先突破的限制，如果小芯片GPU有著SLI和CrossFire一樣大的延遲的話，無疑也會淡出人們的視野。

原文標(biāo)題：在小芯片CPU嘗到甜頭，AMD向Chiplet GPU進(jìn)發(fā)！

文章出處：【微信公眾號：電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

責(zé)任編輯：haq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

芯片

芯片

+關(guān)注

關(guān)注
456

文章
50886

瀏覽量
424176
amd

amd

+關(guān)注

關(guān)注
25

文章
5470

瀏覽量
134233
cpu

cpu

+關(guān)注

關(guān)注
68

文章
10872

瀏覽量
211999
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4743

瀏覽量
128992

原文標(biāo)題：在小芯片CPU嘗到甜頭，AMD向Chiplet GPU進(jìn)發(fā)！

文章出處：【微信號：elecfans，微信公眾號：電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

AMD最強(qiáng)AI芯片，性能強(qiáng)過英偉達(dá)H200，但市場仍不買賬，生態(tài)是最大短板？

電子發(fā)燒友網(wǎng)報(bào)道（文/吳子鵬）當(dāng)?shù)貢r(shí)間本周四，AMD在AMD Advancing AI 2024上發(fā)布了一系列新品，包括全新旗艦AI芯片、服務(wù)器CPU、AI網(wǎng)卡、DPU和AI PC移動

發(fā)表于 10-14 01:32 ?3462次閱讀

<b class='flag-5'>AMD</b>最強(qiáng)AI<b class='flag-5'>芯片</b>，性能強(qiáng)過英偉達(dá)H200，但市場仍不買賬，生態(tài)是最大短板？

英特爾12月或發(fā)布Battlemage GPU芯片

近日，有關(guān)英特爾即將在12月發(fā)布全新Battlemage GPU芯片的傳聞再次被證實(shí)。據(jù)硬件挖掘者和泄密者Tomasz Gawrońsk分享的預(yù)告圖顯示，英特爾極有可能在AMD RDNA 4和英偉達(dá)Blackwell之前，率先推

發(fā)表于 11-19 17:37 ?420次閱讀

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

封裝到一個(gè)超長的指令字中，然后CPU中有對應(yīng)寬度的 ALU 來完成相應(yīng)的指令操作。這是一種非常經(jīng)濟(jì)的硬件設(shè)計(jì)方式，它的核心邏輯是通過簡單的硬件構(gòu)造，實(shí)現(xiàn)盡可能高的指令并行度。總的來說，GPU在圖形

發(fā)表于 11-03 12:55

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

本帖最后由 1653149838.791300 于 2024-10-16 22:19 編輯感謝平臺提供的書籍，厚厚的一本，很有分量，感謝作者的傾力付出成書。本書主要講算力芯片CPU

發(fā)表于 10-15 22:08

AMD發(fā)布新一代AI芯片MI325X

在舊金山舉辦的Advancing AI 2024大會上，AMD正式推出了其新一代AI芯片——GPU AMD Instinct MI325X。這款芯片

發(fā)表于 10-11 15:55 ?418次閱讀

蘋果 A18 芯片發(fā)布：CPU 提升 30%、GPU 提升 40%

核 CPU 包括 2 個(gè)性能核心和 4 個(gè)效率核心，比 iPhone 15 的 A16 Bionic 快 30%，能耗降低 30% 。 GPU 方面，A18 芯片的 5 核 GPU

發(fā)表于 09-11 12:19 ?655次閱讀

名單公布！【書籍評測活動NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

和像素統(tǒng)一的G80到現(xiàn)在重金難求的H100；AMD的Zen系列CPU和RDNA系列GPU兩線作戰(zhàn)；中國的高性能計(jì)算芯片逐步獲得更多TOP500排名；華為Ascend 910 NPU

發(fā)表于 09-02 10:09

自動駕駛?cè)笾髁?b class='flag-5'>芯片架構(gòu)分析

當(dāng)前主流的AI芯片主要分為三類，GPU、FPGA、ASIC。GPU、FPGA均是前期較為成熟的芯片架構(gòu)，屬于通用型芯片。ASIC屬于為AI特

發(fā)表于 08-19 17:11 ?1651次閱讀

自動駕駛?cè)笾髁?b class='flag-5'>芯片</b>架構(gòu)分析

CPU渲染和GPU渲染優(yōu)劣分析

GPU的出現(xiàn)，基于GPU的渲染獲得了很大的普及。這些GPU是特定用途的芯片，在某些情況下提供與CPU渲染相當(dāng)?shù)慕Y(jié)果。從廣義上講，

發(fā)表于 05-23 08:27 ?604次閱讀

<b class='flag-5'>CPU</b>渲染和<b class='flag-5'>GPU</b>渲染優(yōu)劣分析

X-Silicon發(fā)布RISC-V新架構(gòu) 實(shí)現(xiàn)CPU/GPU一體化

X-Silicon 的芯片與其他架構(gòu)不同，其設(shè)計(jì)將 CPU 和 GPU 的功能整合到單核架構(gòu)中。這與英特爾和 AMD 的典型設(shè)計(jì)不同，前者有獨(dú)立的

發(fā)表于 04-08 11:34 ?598次閱讀

RISC-V芯片新突破：CPU與GPU一體化核心設(shè)計(jì)

X-Silicon 的芯片與其他架構(gòu)不同，其設(shè)計(jì)將 CPU 和 GPU 的功能結(jié)合到單核架構(gòu)中。這與 Intel 和 AMD 的典型設(shè)計(jì)不同，后者有獨(dú)立的

發(fā)表于 04-07 10:41 ?737次閱讀

Nvidia與AMD新芯片，突破PCIe瓶頸

AMD 和 Nvidia 的 GPU 都依賴 PCI 總線與 CPU 進(jìn)行通信。CPU 和 GPU 有兩個(gè)不同的內(nèi)存域，數(shù)據(jù)必須通過 PCI

發(fā)表于 03-08 14:15 ?692次閱讀

汽車通信芯片匯總梳理

一、CPU/GPU/FPGA/ASIC芯片CPU/GPU/FPGA/ASIC芯片是智能汽車的“大

發(fā)表于 02-20 16:44 ?1640次閱讀

為什么GPU比CPU更快？

GPU比CPU更快的原因并行處理能力：GPU可以同時(shí)處理多個(gè)任務(wù)和數(shù)據(jù)，而CPU通常只能一次處理一項(xiàng)任務(wù)。這是因?yàn)?b class='flag-5'>GPU的架構(gòu)使得它可以同時(shí)