RISC-V 不再滿足于顛覆 CPU 行業(yè)。它正在對(duì)集成到 SoC 或高級(jí)封裝中的每種類型的處理器發(fā)動(dòng)戰(zhàn)爭(zhēng),這是一項(xiàng)雄心勃勃的計(jì)劃,將面臨來(lái)自擁有雄厚研發(fā)業(yè)務(wù)和構(gòu)建良好生態(tài)系統(tǒng)的老牌廠商的激烈競(jìng)爭(zhēng)。
當(dāng) RISC-V International 首席執(zhí)行官 Calista Redmond 在去年的峰會(huì)上表示 RISC-V 將無(wú)處不在時(shí),大多數(shù)人可能認(rèn)為她在談?wù)?CPU。很明顯,該組織打算在服務(wù)器和深度嵌入式設(shè)備中使用 RISC-V 內(nèi)核。但該組織的目標(biāo)遠(yuǎn)不止于此。Redmond暗示,每個(gè)處理核心、GPU、GPGPU、AI 處理器以及尚未構(gòu)思的所有其他類型的處理器都將基于 RISC-V。加州大學(xué)伯克利分校教授兼 RISC-V 國(guó)際主席 Krste Asanovi? 在他的國(guó)情咨文中展示了下面的幻燈片,這一點(diǎn)變得更加清晰。
如今,隨著最近完成的安全和加密工作,這一愿景開(kāi)始成形。正在組建小組并審查捐款,以增加對(duì)矩陣乘法的支持,矩陣乘法是 GPU 和 AI 處理器的基本功能。
這些大膽聲明的背后是數(shù)據(jù)和計(jì)算架構(gòu)的根本性轉(zhuǎn)變。這不再是哪家公司擁有最快的CPU的問(wèn)題,因?yàn)闊o(wú)論設(shè)計(jì)得多么好,所有的CPU都有局限性。“在一些垂直市場(chǎng),例如 5/6G、推理和視頻處理,它們的計(jì)算工作負(fù)載不再適合在傳統(tǒng) CPU 上處理,”西門子 EDA 的 Catapult HLS 團(tuán)隊(duì)項(xiàng)目總監(jiān) Russell Klein表示。“這就是我們看到新計(jì)算方法被采用的地方。”
幾乎每個(gè)應(yīng)用程序都有某種形式的控制結(jié)構(gòu)。“從內(nèi)存訪問(wèn)的角度來(lái)看,圖形是一種非常特殊的野獸,具有非常特殊的要求,”Arteris 解決方案和業(yè)務(wù)開(kāi)發(fā)副總裁 Frank Schirrmeister說(shuō)道。“如果你看一下最近發(fā)布的一些 AI 和 RISC-V 公告,你會(huì)發(fā)現(xiàn)有些公司宣布的處理元素顯然包含 ISA。”
在某些情況下,這些只需要正確的說(shuō)明。Bluespec 首席執(zhí)行官 Charlie Hauck 表示:“RISC-V 有一種叫做向量擴(kuò)展的東西。” “根據(jù)您如何實(shí)現(xiàn)這一點(diǎn),您可以獲得一些看起來(lái)非常像 GPU 的東西,其中有許多并行運(yùn)行的小型單元,或者以 SIMD 類型的方式運(yùn)行。”
然而,這條路并不容易。“通過(guò)指令擴(kuò)展將GPU功能添加到RISC-V架構(gòu)中很有吸引力,因?yàn)镚PU在AI領(lǐng)域發(fā)揮著重要作用,”Stream Computing研發(fā)總監(jiān)Fujie Fan表示。“然而,我們已經(jīng)意識(shí)到架構(gòu)和生態(tài)系統(tǒng)中不可避免的問(wèn)題。”
懷疑論者比比皆是。處理器的歷史上充斥著失敗的初創(chuàng)公司,它們宣稱他們將用新的計(jì)算架構(gòu)粉碎競(jìng)爭(zhēng)。許多人沒(méi)有考慮到競(jìng)爭(zhēng)并沒(méi)有停滯不前,計(jì)算領(lǐng)域正在經(jīng)歷持續(xù)且加速的變化,而轉(zhuǎn)向新方法和工具以及培訓(xùn)/再培訓(xùn)工程師的痛苦和費(fèi)用絕非微不足道。
“RISC-V 為采用者帶來(lái)的價(jià)值在于控制處理領(lǐng)域,它擁有現(xiàn)成的開(kāi)源工具、現(xiàn)成的操作系統(tǒng)(Linux 或?qū)崟r(shí))以及提供的長(zhǎng)期軟件兼容性/可移植性的承諾通過(guò) ISA 通用性,” Quadric工程副總裁 Dhanendra Jani 說(shuō)道。“圖形處理是一個(gè)非常不同的挑戰(zhàn)——特定領(lǐng)域的處理挑戰(zhàn)。要將基本 RISC-V 指令集調(diào)整為一種非常適合 GPU 任務(wù)的指令集,需要大量投資來(lái)定義自定義 ISA 擴(kuò)展、構(gòu)建高度復(fù)雜的微架構(gòu)更改,并對(duì)開(kāi)源工具進(jìn)行重大手術(shù),使它們與原來(lái)不同。這樣做時(shí),使用 RISC-V 的幾乎所有固有價(jià)值都因廣泛的定制而消失了,您將失去大部分優(yōu)勢(shì),同時(shí)可能會(huì)受到核心 ISA 功能的束縛,這些功能限制了特定領(lǐng)域 GPU 環(huán)境中的有用性。簡(jiǎn)而言之,從 RISC-V 開(kāi)始而不是從頭開(kāi)始有什么意義呢?”
那么RISC-V的計(jì)劃是什么?“矢量是 SIMD 操作,使您能夠同時(shí)對(duì)多條數(shù)據(jù)進(jìn)行操作,并讓芯片找出從內(nèi)存中取出數(shù)據(jù)的最佳方式,處理單個(gè)指令,然后將數(shù)據(jù)放回內(nèi)存,或者將它們轉(zhuǎn)移到下一個(gè)操作,”RISC-V International 首席技術(shù)官 Mark Himelstein 說(shuō)道。“缺少的基本內(nèi)容是矩陣乘法。我們收到了多個(gè)提案,其中之一類似于適合 32 位指令的向量擴(kuò)展。這非常困難并且需要設(shè)置說(shuō)明。您設(shè)置了stride和masks等內(nèi)容,然后扣動(dòng)扳機(jī)并執(zhí)行操作。但如果您想與其他架構(gòu)上更大的矩陣實(shí)現(xiàn)競(jìng)爭(zhēng),則必須采用更寬的 64 位指令。這是很多人都在談?wù)摰脑掝}。”
問(wèn)題是有多少?gòu)?fù)雜性被暴露,有多少仍然隱藏。“ISA 是一個(gè)關(guān)鍵組件,” Arm客戶端業(yè)務(wù)線產(chǎn)品管理高級(jí)總監(jiān) Anand Patel 說(shuō)道。“然而,GPU 的復(fù)雜性通常由 Vulkan 或 OpenCL 等標(biāo)準(zhǔn) API 抽象出來(lái)。這使得開(kāi)發(fā)人員可以更輕松地跨多個(gè)供應(yīng)商進(jìn)行定位,同時(shí)將較低級(jí)別的優(yōu)化留給 GPU 供應(yīng)商。即使在 GPGPU 類型的應(yīng)用中,GPU 的架構(gòu)也在快速發(fā)展,以跟上人工智能處理等新興用例的步伐,因此開(kāi)發(fā)人員能夠訪問(wèn)成熟的軟件生態(tài)系統(tǒng)來(lái)跟上這些變化至關(guān)重要。標(biāo)準(zhǔn) API 確保開(kāi)發(fā)人員不必?fù)?dān)心 ISA 更改,而是透明地看到這些底層改進(jìn)的好處。”
宏觀架構(gòu)和微架構(gòu)
區(qū)分這兩個(gè)問(wèn)題很重要,因?yàn)?RISC-V 僅定義了宏觀架構(gòu),而將所有微架構(gòu)決策留給了實(shí)現(xiàn)者。當(dāng)超越 CPU 時(shí),這將成為一個(gè)更大的問(wèn)題。“馮·諾依曼在某些方面有限制性,但特定實(shí)現(xiàn)如何與內(nèi)存交互并不是由 RISC-V 決定的,”RISC-V 的 Himelstein 說(shuō)。“大多數(shù) GPU 實(shí)現(xiàn)都通過(guò)多級(jí)管道中的內(nèi)存來(lái)優(yōu)化這一點(diǎn)。當(dāng)一些操作正在進(jìn)行時(shí),一些東西來(lái)自內(nèi)存。當(dāng)您開(kāi)始研究 GPU 時(shí),您會(huì)談?wù)摫┞秲?nèi)存交互。我們確實(shí)對(duì)事情發(fā)生的順序有一些限制,因?yàn)槟阆氪_保操作被明確定義。”
看待問(wèn)題的方法有很多種。“最先進(jìn)的 GPU 產(chǎn)品可以按照傳統(tǒng)圖形處理和現(xiàn)代人工智能加速來(lái)劃分,”Stream 的 Fan 說(shuō)道。“前者更像是可編程ASIC,而不是通用處理器,其核心能力來(lái)自于流處理器的實(shí)現(xiàn),而不是ISA。指令集通常對(duì)程序員來(lái)說(shuō)是不可見(jiàn)的,并且總是處于次要位置。圖形處理器的設(shè)計(jì)與微架構(gòu)密切相關(guān),適合用定制指令來(lái)實(shí)現(xiàn)。對(duì)于我們大多數(shù)人來(lái)說(shuō),人工智能和多媒體功能的標(biāo)準(zhǔn)化更具吸引力。要實(shí)現(xiàn)這樣的能力,復(fù)制GPU并不是唯一的方法。對(duì)于RISC-V來(lái)說(shuō),多媒體功能可以通過(guò)矢量架構(gòu)來(lái)實(shí)現(xiàn),AI能力可以通過(guò)更高效的異構(gòu)架構(gòu)和矩陣加速器來(lái)實(shí)現(xiàn)。”
如果您希望外部程序員為您的設(shè)備編寫軟件,則某些方面會(huì)發(fā)生變化。“數(shù)據(jù)流處理可以通過(guò)多種方式完成,”西門子的Klein說(shuō)。“一種是使用小型通用處理器甚至專用處理器的管道,每個(gè)處理器都處理問(wèn)題的一個(gè)階段。這比單個(gè)大型 CPU 更快、更高效。使用可編程處理器作為計(jì)算元件保留了很大的靈活性,但確實(shí)放棄了一些性能和效率。這種方法確實(shí)可以在任何有能力的多核處理器上構(gòu)建。問(wèn)題是這種方法已被軟件開(kāi)發(fā)社區(qū)徹底拒絕,他們不愿意放棄單線程編程模型。”
這對(duì)于很多企業(yè)來(lái)說(shuō)都是一個(gè)大問(wèn)題。“如果您正在尋找通用處理器,根據(jù)應(yīng)用要求,它可以是從單級(jí)、兩級(jí)或三級(jí)微控制器一直到運(yùn)行多級(jí)的多級(jí)超標(biāo)量設(shè)計(jì)。Bluespec 的 Hauck 說(shuō)道。“或者,你會(huì)看到人們擁有 4096 個(gè) RISC-V 處理器,每個(gè)處理器都是小型、簡(jiǎn)化的 RV32I 類型的東西,它們被組合在特定的系統(tǒng)架構(gòu)和互連中,使這些東西能夠按照 GPU 的精神運(yùn)行。它們由許多較小的整數(shù)單元組成,這些單元共同協(xié)作完成一項(xiàng)艱巨的任務(wù)。挑戰(zhàn)在于如何為此開(kāi)發(fā)軟件?”
有了更大的靈活性,可能需要新的方法。“在大型 HPC 中,如果您運(yùn)行的工作負(fù)載更加面向數(shù)據(jù)中心,則它具有一組特定的特征。但如果您的應(yīng)用程序是科學(xué)應(yīng)用程序,也許有一些關(guān)于加載和存儲(chǔ)以及多種數(shù)學(xué)類型運(yùn)算的功能可以擴(kuò)展,”西門子 EDA 首席產(chǎn)品營(yíng)銷經(jīng)理 Andy Meyer 說(shuō)道。“如果人們選擇這條路線,生態(tài)系統(tǒng)就會(huì)面臨一些挑戰(zhàn)。最大的增長(zhǎng)領(lǐng)域是超大規(guī)模應(yīng)用。如果你看看風(fēng)險(xiǎn)投資的金額,你就會(huì)發(fā)現(xiàn)他們顯然正在解決一個(gè)獨(dú)特的問(wèn)題。”
軟件和生態(tài)系統(tǒng)
硬件/軟件協(xié)同設(shè)計(jì)一直是幾十年來(lái)的目標(biāo),而 RISC-V 是少數(shù)幾個(gè)取得進(jìn)展的領(lǐng)域之一。“傳統(tǒng)的數(shù)據(jù)處理設(shè)計(jì)不遺余力地將硬件和軟件分開(kāi),”Klein說(shuō)。“硬件被創(chuàng)建出來(lái),然后軟件人員就可以在上面自由發(fā)揮。假設(shè)是,如果硬件足夠通用,那么軟件將能夠完成提供系統(tǒng)功能所需的任何操作。如果您的計(jì)算能力和功耗有足夠的余量,那么這是可行的。我不會(huì)說(shuō)它效果很好,但它確實(shí)有效,盡管相當(dāng)浪費(fèi)。”
特定領(lǐng)域的計(jì)算開(kāi)始改變這一點(diǎn)。“要真正發(fā)揮數(shù)據(jù)流處理器的潛力就意味著針對(duì)特定應(yīng)用程序進(jìn)行定制,”Klein 補(bǔ)充道。“這意味著硬件和軟件團(tuán)隊(duì)需要共同努力才能取得成功。這讓很多組織和設(shè)計(jì)團(tuán)隊(duì)感到非常不舒服。”
有時(shí)協(xié)同設(shè)計(jì)是唯一的方法。“假設(shè)您需要在邊緣進(jìn)行一些處理,”Bluespec 的 Hauck 說(shuō)。“總會(huì)存在外形尺寸、尺寸或功率限制。再多的軟件創(chuàng)新也無(wú)濟(jì)于事。如果您有一個(gè)軟件堆棧,那么該堆棧就是它的本質(zhì)。您將無(wú)法對(duì)任何具有這些類型的約束的特定解決方案進(jìn)行軟件優(yōu)化。你必須進(jìn)入硬件領(lǐng)域。”
創(chuàng)建嵌入式系統(tǒng)時(shí),處理器接觸到廣泛編程受眾的可能性較小,并且可以進(jìn)行更多優(yōu)化。“考慮一下已經(jīng)完成的矢量加密工作,”Himelstein說(shuō)。“沒(méi)有人會(huì)在他們的程序中編寫矢量加密。這不是他們所做的。他們所做的是使用庫(kù),例如 libSSL 或其他一些加密庫(kù),并且使用這些指令。有時(shí)他們通過(guò)匯編語(yǔ)言來(lái)使用它們,然后提供 C、C++ 或 Java 接口,以便程序、應(yīng)用程序可以利用它們。”
當(dāng)需要通用編程時(shí),它就會(huì)變得更加困難。“如果你看看 GPU 的生態(tài)系統(tǒng),就會(huì)發(fā)現(xiàn)工具鏈?zhǔn)怯?NVIDIA 控制的,”Fan 說(shuō)。“包括AMD在內(nèi)的其他競(jìng)爭(zhēng)對(duì)手曾試圖打破壟斷,但失敗了。通過(guò)擴(kuò)展RISC-V的標(biāo)準(zhǔn)指令集來(lái)兼容不斷更新的NVIDIA生態(tài)系統(tǒng)幾乎是不可能的。另一方面,重新開(kāi)始也很難,因?yàn)?NVIDIA 具有先發(fā)優(yōu)勢(shì)。”
成功的時(shí)刻
盡管如此,RISC-V 的核心在于實(shí)現(xiàn)創(chuàng)新。“我們所看到的關(guān)于為什么遺留解決方案是目前最佳解決方案的許多觀點(diǎn)都是歷史性的,”Hauck 說(shuō)。“智能架構(gòu)師和智能軟件開(kāi)發(fā)人員真正發(fā)揮其專業(yè)知識(shí)的地方將是 RISC-V 類型的環(huán)境。”
它始于公共需求。“如果有需要,人們就會(huì)聚集在一起進(jìn)行協(xié)作,而 RISC-V 就是協(xié)作,”西門子的 Meyer 說(shuō)道。“你會(huì)看到一個(gè)又一個(gè)的例子,世界各地正在發(fā)生各種不同的倡議和聯(lián)盟。生態(tài)系統(tǒng)將會(huì)發(fā)展,但商業(yè)方面和支持社區(qū)之間需要保持平衡。”
這可能會(huì)帶來(lái)一些業(yè)務(wù)挑戰(zhàn),尤其是在收回投資回報(bào)時(shí)。“RISC-V 還需要一段時(shí)間才能趕上并與成熟的產(chǎn)品和生態(tài)系統(tǒng)競(jìng)爭(zhēng),”Hauck 說(shuō)。“但你會(huì)開(kāi)始發(fā)現(xiàn),對(duì)于某些應(yīng)用程序,只要有合適的公司支持,RISC-V 處理器就沒(méi)有理由不能成功。那里有很多優(yōu)秀的軟件開(kāi)發(fā)人員。最終他們會(huì)到達(dá)那里,因?yàn)樯鐓^(qū)擁有他們創(chuàng)新所需的所有工具。”
那么我們還要多久才能看到 RISC-V GPU 和 AI 處理器呢?Himelstein 表示:“如果您想要為非 GPU 類型的世界提供合理的 AI 功能補(bǔ)充,那么今天您已經(jīng)擁有了。” “但是,經(jīng)過(guò)批準(zhǔn)的矩陣以及這些團(tuán)體一直要求的所有其他內(nèi)容的完整補(bǔ)充可能會(huì)在大約一年半的時(shí)間內(nèi)出現(xiàn),其中基本內(nèi)容可能會(huì)出現(xiàn),然后高級(jí)內(nèi)容可能會(huì)在三到四年內(nèi)出現(xiàn)”。
增量方法可以使部件的使用速度更快。Fan 表示:“分別標(biāo)準(zhǔn)化每個(gè) GPU 功能比標(biāo)準(zhǔn)化整個(gè) GPU 產(chǎn)品要好得多。” “至于人工智能功能,我們認(rèn)為正在進(jìn)行的 RISC-V 矩陣擴(kuò)展對(duì)于 IC 設(shè)計(jì)人員來(lái)說(shuō)是更好的選擇。”
審核編輯:劉清
-
處理器
+關(guān)注
關(guān)注
68文章
19595瀏覽量
232206 -
SoC芯片
+關(guān)注
關(guān)注
1文章
621瀏覽量
35377 -
人工智能
+關(guān)注
關(guān)注
1801文章
48259瀏覽量
243372 -
RISC-V
+關(guān)注
關(guān)注
46文章
2423瀏覽量
47600 -
GPU芯片
+關(guān)注
關(guān)注
1文章
304瀏覽量
6036
原文標(biāo)題:RISC-V,要顛覆GPU?
文章出處:【微信號(hào):算力基建,微信公眾號(hào):算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
芯來(lái)科技亮相RISC-V Day Tokyo 2025
RISC-V可能顛覆半導(dǎo)體行業(yè)格局的5種方式

什么是RISC-V?以及RISC-V和ARM、X86的區(qū)別
ISA ARM 對(duì)比 RISC-V
加入全球 RISC-V Advocate 行列,共筑 RISC-V 的未來(lái) !

RISC-V Summit China 2024 青稞RISC-V+接口PHY,賦能RISC-V高效落地

RISC-V Summit China 2024 | 青稞RISC-V+接口PHY,賦能RISC-V高效落地
2024 RISC-V 中國(guó)峰會(huì):華秋電子助力RISC-V生態(tài)!

2024 RISC-V 中國(guó)峰會(huì):華秋電子助力RISC-V生態(tài)!
risc-v的發(fā)展歷史
rIsc-v的缺的是什么?
【RISC-V信息速遞】反X86和ARM壟斷?很多人低估了RISC-V的顛覆性

RISC-V有哪些優(yōu)點(diǎn)和缺點(diǎn)
RISC-V有哪些優(yōu)缺點(diǎn)?是堅(jiān)持ARM方向還是投入risc-V的懷抱?
解鎖RISC-V技術(shù)力量丨曹英杰:RISC-V與大模型探索

評(píng)論