伊人玖玖,甜宠高h道具各种play,在线亚洲播放

2023年8月23日，英偉達宣布下一代汽車芯片Thor量產時間略有推遲，正式量產在2026財年，英偉達的財政年度與自然年相差11個月，也就是說正式量產最遲可能是2026年1月。

FY2019-FY2024H1英偉達自動駕駛及AI座艙業績情況

圖片來源：英偉達

英偉達通常兩年升級一次芯片架構。在2022年英偉達透露即將在2024年推出Blackwell架構，而Thor也會采用Blackwell架構。

Blackwell是致敬美國統計學家，加利福尼亞大學伯克利分校統計學名譽教授，拉奧-布萊克韋爾定理的提出者之一David Harold Blackwell。

英偉達Blackwell架構

Blackwell架構將采用COPA-GPU設計。很多人認為COPA-GPU就是Chiplet，不過COPA-GPU不是嚴格意義上的Chiplet，眾所周知，英偉達一直對Chiplet缺乏興趣。在2017年英偉達曾提出非常近似Chiplet的MCM設計，但在2021年12月，英偉達發表了一篇名為《GPU Domain Specialization via Composable On-Package Architecture》的論文，應該就是Blackwell架構的論文，這篇論文則否定了Chiplet設計。

2017年6月英偉達發表論文《MCM-GPU: Multi-Chip-Module GPUs for Continued Performance Scalability》提出了MCM設計。

MCM-GPU設計

圖片來源：英偉達

MCM-GPU設計基本就是現在比較火爆的Chiplet設計，但英偉達一直未將MCM付諸實際設計中。英偉達一直堅持Monolithic單一光刻設計，這是因為die與die之間通訊帶寬永遠無法和monolithic內部的通訊帶寬相比，換句話說Chiplet不適合高AI算力場合，在純CPU領域是Chiplet的最佳應用領域。

MCM-GPU架構

圖片來源：英偉達

英偉達2017年論文提及的MCM-GPU架構如上圖。英偉達在MCM-GPU架構里主要引入了L1.5緩存，它介于L1緩存和L2緩存之間，XBAR是Crossbar，英偉達的解釋是The Crossbar (XBAR) is responsible for carrying packets from a given source unit to a specific destination unit，有點像交換或路由。GPM就是GPU模塊。

不同容量L1.5緩存下各種應用的速度對比

圖片來源：英偉達

上圖是英偉達2017年論文仿真不同容量L1.5緩存下各種應用的速度對比，不過彼時各種應用還是各種浮點數學運算和存儲密集型算子，而非深度學習。

Transformer時代相對CNN時代，存儲密集型算子所占比例大幅增加。

以上是Transformer的計算過程，在此計算過程中，矩陣乘法是典型的計算密集型算子，也叫GEMM（通用矩陣乘法）。存儲密集型算子分兩種，一種是矢量或張量的神經激活，多非線性運算，也叫GEMV （通用矩陣矢量乘法）。另一種是逐點元素型element-wise，典型的如矩陣反轉，實際沒有任何運算，只是存儲行列對調。

三星對GPT大模型workload分析

圖片來源：三星

上圖中，在運算操作數量上，GEMV所占比例高達86.53%，在大模型運算延遲分析上，82.27%的延遲都來自GEMV；GEMM占比只有2.12%；非線性運算也就是神經元激活部分占的比例也遠高于GEMM。

三星對GPU利用率的分析

圖片來源：三星

上圖可以看出在GEMV算子時，GPU的利用率很低，一般不超過20%，換句話說80%的時間GPU都是在等待存儲數據的搬運。GPU的靈活性還是比較高的，如果換做靈活性比較差的AI專用加速器，如谷歌的TPU，那么GEMV的利用率會更低，不到10%甚至5%。

三星的GPT瓶頸分析

圖片來源：三星

Roof-line訪存與算力模型

圖片來源：互聯網

上圖是鼎鼎大名的roof-line訪存與算力模型。

COPA-GPU架構

圖片來源：英偉達

上圖是2021年12月英偉達論文提出的COPA-GPU架構，實際就是把一個特別大容量的L2緩存die分離出來。因為如果還是monolithic設計，那么整個die的面積會超過1000平方毫米，不過***決定了芯片的最大die size不超過880平方毫米，所以必須將L2分離。

注：GPU-N就是英偉達的COPA-GPU。

圖片來源：英偉達

不同容量L2緩存對應的延遲

圖片來源：英偉達

上圖是不同容量L2緩存對應的延遲情況，顯然L2緩存越高，延遲越低，不過在small-batch時不明顯。

幾種COPA-GPU的封裝分析

圖片來源：英偉達

從英偉達的論文里我們看不到架構方面的絲毫改進，只有封裝領域的改變。這篇論文實際應該由臺積電來寫，因為英偉達完全無法掌控芯片的封測工藝，CoWoS就是為英偉達這種設計而設計的，而CoWoS誕生在10年以前。

大模型不斷消耗更多的算力和存儲，這顯然違背了自然界效率至上的原則，或許人類正在錯誤的道路上狂奔。

免責說明：本文觀點和數據僅供參考，和實際情況可能存在偏差。本文不構成投資建議，文中所有觀點、數據僅代表筆者立場，不具有任何指導、投資和決策意見。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

gpu

gpu

+關注

關注
28

文章
4729

瀏覽量
128890
芯片架構

芯片架構

+關注

關注
1

文章
30

瀏覽量
14557
英偉達

英偉達

+關注

關注
22

文章
3770

瀏覽量
90986

原文標題：英偉達江郎才盡，下一代芯片架構變化只是封裝

文章出處：【微信號：zuosiqiche，微信公眾號：佐思汽車研究】歡迎添加關注！文章轉載請注明出處。

今日看點丨龍芯中科：下一代桌面芯片3B6600預計明年上半年交付流片；消息稱英偉達 Thor 芯片量產大幅推遲

方面，龍芯中科下一代服務器芯片3C6000目前處于樣片階段，預計2025年Q2完成產品化并正式發布。根據內部自測的結果，公司16核32線程的3C6000/S性能可對標至強4314，雙硅片封裝的32核

發表于 12-17 11:17 ?484次閱讀

英偉達加速Rubin平臺AI芯片推出,SK海力士提前交付HBM4存儲器

日，英偉達（NVIDIA）的主要高帶寬存儲器（HBM）供應商南韓SK集團會長崔泰源透露，英偉達執行長黃仁勛已要求SK海力士提前六個月交付用于英偉達下一代AI

發表于 11-05 14:22 ?404次閱讀

通過下一代引線式邏輯IC封裝實現小型加固型應用

電子發燒友網站提供《通過下一代引線式邏輯IC封裝實現小型加固型應用.pdf》資料免費下載

發表于 08-29 11:05 ?0次下載

通過<b class='flag-5'>下一代</b>引線式邏輯IC<b class='flag-5'>封裝</b>實現小型加固型應用

IaaS+on+DPU(IoD)+下一代高性能算力底座技術白皮書

大規模生產環境落地應用的條件。某種程度上，IoD 技術已成為下一代高性能算力底座的核心技術與最佳實踐。白皮書下載：*附件：IaaS+on+DPU(IoD)+下一代高性能算力底座+技術白皮書(1).pdf

發表于 07-24 15:32

24芯M16插頭在下一代技術中的潛力

　　德索工程師說道隨著科技的飛速發展，下一代技術正逐漸展現出其獨特的魅力和潛力。在這一背景下，24芯M16插頭作為一種高性能、多功能的連接器，將在下一代技術中發揮至關重要的作用。以下是

發表于 06-15 18:03 ?331次閱讀

24芯M16插頭在<b class='flag-5'>下一代</b>技術中的潛力

英偉達加速AI芯片迭代，推出Rubin架構計劃

在近日舉辦的COMPUTEX 2024展會上，英偉達CEO黃仁勛再次展現了公司在人工智能（AI）芯片領域的雄心壯志。他公布了下一代AI芯片架構

發表于 06-03 11:36 ?798次閱讀

英偉達業績強勁，Blackwell AI芯片助推下一波增長?

　在與分析師的電話會議上，英偉達首席執行官黃仁勛透露，公司即將推出的Blackwell AI芯片將于本季度發貨，下季度產量將有所提升，“隨著下一代Blackwell架構

發表于 05-23 15:55 ?480次閱讀

豐田、日產和本田將合作開發下一代汽車的AI和芯片

豐田、日產和本田等日本主要汽車制造商確實計劃聯手開發下一代汽車的軟件，包括在生成式人工智能（AI）和半導體（芯片）等領域進行合作。

發表于 05-20 10:25 ?969次閱讀

進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

2024年3月19日，[英偉達]CEO[黃仁勛]在GTC大會上公布了新一代AI芯片架構BLACKWELL，并推出基于該架構的超級

發表于 05-13 17:16

使用NVIDIA Holoscan for Media構建下一代直播媒體應用

NVIDIA Holoscan for Media 現已向所有希望在完全可重復使用的集群上構建下一代直播媒體應用的開發者開放。

發表于 04-16 14:04 ?664次閱讀

英偉達攜手臺積電、新思科技，力推下一代半導體芯片制造技術

英偉達與臺積電、 Synopsys 已做出決策，將在其軟件環境、制造工藝以及系統上整合英偉達的 cuLitho 計算光刻平臺。此舉旨在大幅提升芯片制造速率，并為英偉達即將推出的 Bla

發表于 03-19 11:41 ?670次閱讀

英偉達的下一代AI芯片

根據英偉達(Nvidia)的路線圖，它將推出其下一代black well架構很快。該公司總是先推出一個新的架構與數據中心產品，然后在幾個月后

發表于 03-08 10:28 ?905次閱讀

英偉達：預計下一代AI芯片B100短缺，計劃擴產并采用新架構

近期熱門的 H100 芯片運期短縮數天后，英偉達新型 AI 旗艦芯片 B100搭載全新的 Blackwell，有望使 AI 計算性能提升至 2~3 倍。鑒于 AI 芯片市場需求旺盛，外

發表于 02-25 09:29 ?909次閱讀

下一代掌機芯片，深度學習、光線追蹤還有與VR/AR聯動？

、英偉達、AMD 和高通等。然而，對于下一代掌機芯片，我們還有什么可以期待的突破呢？ ? 深度學習+光線追蹤 ? 要說賣得最好的掌機芯片，那無疑是任天堂Switch掌機所搭載的

發表于 01-09 00:04 ?1659次閱讀

英偉達智能駕駛的核心芯片——Thor

英偉達原定于 2024 年推出 Atlan，現在雷神（Thor）現已取代Atlan，帶來了顯著的性能提升，Thor 帶來了兩杯的性能，推動下一代 GPU 以及新的 Grace Neoverse V2 驅動的核心，進入下一代自動駕

發表于 01-03 14:33 ?3393次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

英偉達江郎才盡，下一代芯片架構變化只是封裝

評論

今日看點丨龍芯中科：下一代桌面芯片3B6600預計明年上半年交付流片；消息稱英偉達 Thor 芯片量產大幅推遲

英偉達加速Rubin平臺AI芯片推出,SK海力士提前交付HBM4存儲器

通過下一代引線式邏輯IC封裝實現小型加固型應用

IaaS+on+DPU(IoD)+下一代高性能算力底座技術白皮書

24芯M16插頭在下一代技術中的潛力

英偉達加速AI芯片迭代，推出Rubin架構計劃

英偉達業績強勁，Blackwell AI芯片助推下一波增長?

豐田、日產和本田將合作開發下一代汽車的AI和芯片

進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

使用NVIDIA Holoscan for Media構建下一代直播媒體應用

英偉達攜手臺積電、新思科技，力推下一代半導體芯片制造技術

英偉達的下一代AI芯片

英偉達：預計下一代AI芯片B100短缺，計劃擴產并采用新架構

下一代掌機芯片，深度學習、光線追蹤還有與VR/AR聯動？

英偉達智能駕駛的核心芯片——Thor