午夜影院在线,亚洲日韩欧美一区二区在线,完整秽淫刺激长篇小说

（文章來源：機器之心Pro）

TSP 的全稱是 Tensor Streaming Processor，專為機器學(xué)習(xí)等 AI 相關(guān)需求打造。該架構(gòu)在單塊芯片上可以實現(xiàn)每秒 1000 萬億（10 的 15 次方）次運算，是全球首個實現(xiàn)該級別性能的架構(gòu)，其浮點運算性能可達每秒 250 萬億次（TFLOPS）。在摩爾定律走向消亡的背景下，這一架構(gòu)的問世標(biāo)志著芯片之爭從晶體管轉(zhuǎn)向架構(gòu)。

250 TFLOPS 浮點運算性能是什么概念？目前的世界第一超級計算機 Summit，其峰值算力為 200,794.9 TFLOPS，它的背后是 28,000 塊英偉達 Volta GPU。如果 TSP 達到了類似的效率，僅需 803 塊就可以實現(xiàn)同樣的性能。Groq 在一份白皮書中介紹了這項全新的架構(gòu)設(shè)計。此外，他們還將在于美國丹佛舉辦的第 23 屆國際超算高峰論壇上展示這一成果。

我們?yōu)檫@一行業(yè)和我們的客戶感到興奮，Groq 的聯(lián)合創(chuàng)始人和 CEO Jonathan Ross 表示。頂級 GPU 公司都在宣稱他們有望在未來幾年向用戶交付一款每秒百萬億次運算性能的產(chǎn)品，但 Groq 現(xiàn)在就做到了，而且建立了一個新的性能標(biāo)準(zhǔn)。就低延遲和推理速度而言，Groq 的架構(gòu)比其他任何用于推理的架構(gòu)都要快許多倍。我們與用戶的互動證明了這一點。

Groq 的 TSP 架構(gòu)是專為計算機視覺、機器學(xué)習(xí)和其他 AI 相關(guān)工作負載的性能要求設(shè)計的。對于一大批需要深度學(xué)習(xí)推理運算的應(yīng)用來說，Groq 的解決方案是非常理想的選擇，Groq 的首席架構(gòu)師 Dennis Abts 表示，但除此之外，Groq 的架構(gòu)還能用于廣泛的工作負載。它的性能和簡潔性使其成為所有高性能即數(shù)據(jù)和計算密集型工作復(fù)雜的理想平臺。

Groq 的這款架構(gòu)受到軟件優(yōu)先（software first）理念的啟發(fā)。它在 Groq 開發(fā)的 TSP 中實現(xiàn)，為實現(xiàn)計算靈活性和大規(guī)模并行計算提供了一種新的范式，但沒有傳統(tǒng) GPU 和 CPU 架構(gòu)的限制和溝通開銷。在 Groq 的架構(gòu)中，Groq 編譯器負責(zé)編碼所有內(nèi)容：數(shù)據(jù)流入芯片，并在正確的時間和正確的地點插入，以確保計算實時進行，沒有停頓。執(zhí)行規(guī)劃由軟件負責(zé)，這樣就可以釋放出原本要用于動態(tài)指令執(zhí)行的寶貴硬件資源。

在傳統(tǒng)的體系架構(gòu)中，將數(shù)據(jù)從 DRAM 移動到處理器需要大量的算力和時間，而且相同工作負載上的處理性能也是可變的。在典型的工作流中，開發(fā)人員通過反復(fù)運行工作負載或程序來對其進行配置和測試，以驗證和度量其平均處理性能。由于處理器接收和發(fā)送數(shù)據(jù)的方式不同，這種處理可能會得到略有差別的結(jié)果，而開發(fā)人員的工作就是手動調(diào)整程序以達到預(yù)定的可靠性級別。

但有了 Groq 的硬件和軟件，編譯器就可以準(zhǔn)確地知道芯片的工作方式以及執(zhí)行每個計算所需的時間。編譯器在正確的時間將數(shù)據(jù)和指令移動到正確的位置，這樣就不會有延遲。到達硬件的指令流是完全編排好的，使得處理速度更快，而且可預(yù)測。開發(fā)人員可以在 Groq 芯片上運行相同的模型 100 次，每次得到的結(jié)果都完全相同。對于安全和準(zhǔn)確性要求都非常高的應(yīng)用來說（如自動駕駛汽車），這種計算上的準(zhǔn)確性至關(guān)重要。

另外，使用 Groq 硬件設(shè)計的系統(tǒng)不會受到長尾延遲的影響，AI 系統(tǒng)可以在特定的功率或延遲預(yù)算內(nèi)進行調(diào)整。這種軟件優(yōu)先的設(shè)計（即編譯器決定硬件架構(gòu)）理念幫助 Groq 設(shè)計出了一款簡單、高性能的架構(gòu)，可以加速推理流程。該架構(gòu)既支持傳統(tǒng)的機器學(xué)習(xí)模型，也支持新的計算學(xué)習(xí)模型，目前在 x86 和非 x86 系統(tǒng)的客戶站點上運行。

為了滿足深度學(xué)習(xí)等計算密集型任務(wù)的需求，芯片的設(shè)計似乎正在變得越來越復(fù)雜。但 Groq 認為，這種趨勢從根本上就是錯誤的。他們在白皮書中指出，當(dāng)前處理器架構(gòu)的復(fù)雜性已經(jīng)成為阻礙開發(fā)者生產(chǎn)和 AI 應(yīng)用部署的主要障礙。當(dāng)前處理器的復(fù)雜性降低了開發(fā)者工作效率，再加上摩爾定律逐漸變慢，實現(xiàn)更高的計算性能變得越來越困難。

Groq 的芯片設(shè)計降低了傳統(tǒng)硬件開發(fā)的復(fù)雜度，因此開發(fā)者可以更加專注于算法（或解決其他問題），而不是為了硬件調(diào)整自己的解決方案。有了這種更加簡單的硬件設(shè)計，開發(fā)者無需進行剖析研究（profiling），因此可以節(jié)省資源，更容易大規(guī)模部署 AI 應(yīng)用。與基于 CPU、GPU 和 FPGA 的傳統(tǒng)復(fù)雜架構(gòu)相比，Groq 的芯片還簡化了認證和部署，使客戶能夠簡單而快速地實現(xiàn)可擴展、單瓦高性能的系統(tǒng)。

Groq 的張量流架構(gòu)可以在任何需要的地方提供算力。與當(dāng)前領(lǐng)先的 GPU、CPU 相比，Groq 處理器的每個晶體管可以實現(xiàn) 3-6 倍的性能提升。這一改進意味著交付性能的提升、延遲的下降以及成本的降低。結(jié)果是，Groq 的架構(gòu)使用起來更加簡單，而且性能高于傳統(tǒng)計算平臺。
（責(zé)任編輯：fqj）

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

谷歌

谷歌

+關(guān)注

關(guān)注
27

文章
6173

瀏覽量
105634
AI芯片

AI芯片

+關(guān)注

關(guān)注
17

文章
1894

瀏覽量
35103

如何測試晶體管的性能常見晶體管品牌及其優(yōu)勢比較

如何測試晶體管的性能 晶體管是電子電路中的基本組件，其性能測試對于確保電路的可靠性和穩(wěn)定性至關(guān)重要。以下是測試晶體管

發(fā)表于 12-03 09:52 ?327次閱讀

晶體管與場效應(yīng)管的區(qū)別晶體管的封裝類型及其特點

晶體管與場效應(yīng)管的區(qū)別工作原理： 晶體管 ：晶體管（BJT）基于雙極型晶體管的原理，即通過控制基極電流來控制集電極和發(fā)射極之間的電流。

發(fā)表于 12-03 09:42 ?308次閱讀

晶體管的輸出特性是什么

晶體管的輸出特性是描述晶體管在輸出端對外部負載的特性表現(xiàn)，這些特性直接關(guān)系到晶體管在各種電路中的應(yīng)用效果和性能。晶體管的輸出特性受到多種因素

發(fā)表于 09-24 17:59 ?704次閱讀

晶體管對CPU性能的影響

晶體管作為CPU（中央處理器）的基本構(gòu)成單元，對CPU的性能有著至關(guān)重要的影響。

發(fā)表于 09-13 17:22 ?891次閱讀

CMOS晶體管的尺寸規(guī)則

CMOS晶體管尺寸規(guī)則是一個復(fù)雜且關(guān)鍵的設(shè)計領(lǐng)域，它涉及到多個方面的考量，包括晶體管的性能、功耗、面積利用率以及制造工藝等。以下將從CMOS晶體管的基本結(jié)構(gòu)、尺寸對

發(fā)表于 09-13 14:10 ?2236次閱讀

NMOS晶體管和PMOS晶體管的區(qū)別

NMOS晶體管和PMOS晶體管是兩種常見的金屬氧化物半導(dǎo)體場效應(yīng)晶體管（MOSFET）類型，它們在多個方面存在顯著的差異。以下將從結(jié)構(gòu)、工作原理、性能特點、應(yīng)用場景等方面詳細闡述NMO

發(fā)表于 09-13 14:10 ?4123次閱讀

GaN晶體管和SiC晶體管有什么不同

GaN（氮化鎵）晶體管和SiC（碳化硅）晶體管作為兩種先進的功率半導(dǎo)體器件，在電力電子、高頻通信及高溫高壓應(yīng)用等領(lǐng)域展現(xiàn)出了顯著的優(yōu)勢。然而，它們在材料特性、性能表現(xiàn)、應(yīng)用場景以及制造工藝等方面存在諸多不同。以下是對這兩種

發(fā)表于 08-15 11:16 ?920次閱讀

GaN晶體管的基本結(jié)構(gòu)和性能優(yōu)勢

GaN（氮化鎵）晶體管，特別是GaN HEMT（高電子遷移率晶體管），是近年來在電力電子和高頻通信領(lǐng)域受到廣泛關(guān)注的一種新型功率器件。其結(jié)構(gòu)復(fù)雜而精細，融合了多種材料和工藝，以實現(xiàn)高效、高頻率和高功率密度的性能。

發(fā)表于 08-15 11:01 ?1201次閱讀

芯片晶體管的深度和寬度有關(guān)系嗎

一、引言有關(guān)系。隨著集成電路技術(shù)的飛速發(fā)展，芯片晶體管作為電子設(shè)備的核心元件，其性能的優(yōu)化和制造技術(shù)的提升成為了行業(yè)關(guān)注的焦點。在晶體管的眾多設(shè)計參數(shù)中，深度和寬度是兩個至關(guān)重要的因

發(fā)表于 07-18 17:23 ?741次閱讀

什么是光電晶體管？光電晶體管的工作原理和結(jié)構(gòu)

光電晶體管是具有三個端子（發(fā)射極、基極和集電極）或兩個端子（發(fā)射極和集電極）的半導(dǎo)體器件，并具有光敏基極區(qū)域。雖然所有晶體管都對光敏感，但光電晶體管專門針對光檢測進行了優(yōu)化。它們采用擴

發(fā)表于 07-01 18:13 ?2311次閱讀

什么是光電<b class='flag-5'>晶體管</b>？光電<b class='flag-5'>晶體管</b>的工作原理和結(jié)構(gòu)

晶體管測試儀的主要作用

晶體管測試儀是一種專門用于測試晶體管的電子設(shè)備，也被稱為晶體管特性圖示儀。它的主要工作原理是利用測試電路對晶體管的各個參數(shù)進行測量，從而評估晶體管

發(fā)表于 05-09 16:37 ?999次閱讀

蘋果M3芯片有多少晶體管組成

蘋果M3芯片在晶體管數(shù)量上有了顯著的提升。具體來說，標(biāo)準(zhǔn)版的M3芯片內(nèi)部集成了250億個晶體管，相比前代M2芯片多了50億個。這一數(shù)量的增加為M3芯片帶來了更為強大的性能，無論是處理日

發(fā)表于 03-08 17:00 ?1051次閱讀

什么是達林頓晶體管？達林頓晶體管的基本電路

達林頓晶體管（Darlington Transistor）也稱為達林頓對（Darlington Pair），是由兩個或更多個雙極性晶體管（或其他類似的集成電路或分立元件）組成的復(fù)合結(jié)構(gòu)。通過這種結(jié)構(gòu)，第一個雙極性晶體管放大的電流

發(fā)表于 02-27 15:50 ?5671次閱讀

晶體管測試儀電路圖分享

晶體管測試儀是一種專門用于測試晶體管的電子設(shè)備，也被稱為晶體管特性圖示儀。其主要工作原理是利用測試電路對晶體管的各個參數(shù)進行測量，從而評估晶體管

發(fā)表于 02-12 14:17 ?5150次閱讀

在特殊類型晶體管的時候如何分析？

管子多用于集成放大電路中的電流源電路。請問對于這種多發(fā)射極或多集電極的晶體管時候該如何分析？按照我的理解，在含有多發(fā)射極或多集電極的晶體管電路時，如果多發(fā)射極或多集電極的每一極分別接到獨立的電源回路中

發(fā)表于 01-21 13:47

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

谷歌采用全新AI架構(gòu)，晶體管性能得到巨幅提升

評論