如今,從數(shù)據(jù)中心到邊緣層,再到萬物智能網(wǎng)絡(luò)的深處,先進的Multi-Die系統(tǒng)實現(xiàn)了前所未有的性能水平。Multi-Die系統(tǒng)不是通用的單體架構(gòu)芯片,而是由一系列異構(gòu)芯片(也稱“小芯片”)組成,其中小芯片針對每個功能組件進行了優(yōu)化。雖然Multi-Die系統(tǒng)具有更高的靈活性并在系統(tǒng)功耗和性能方面表現(xiàn)優(yōu)異,但也帶來了極高的設(shè)計復(fù)雜性。
通用芯粒互連技術(shù)(UCIe)標(biāo)準(zhǔn)于2022年3月發(fā)布,旨在推動Multi-Die系統(tǒng)中Die-to-Die連接的標(biāo)準(zhǔn)化。UCIe可以簡化不同供應(yīng)商和不同工藝技術(shù)芯片之間的互操作性。即便符合UCIe標(biāo)準(zhǔn)的Multi-Die系統(tǒng)在開發(fā)、測試和制造過程中表現(xiàn)良好,但在實際運行時,又如何確保系統(tǒng)的Die-to-Die連接繼續(xù)保持穩(wěn)健安全并經(jīng)過測試驗證呢?本文將探討如何通過IP、測試、硬件加速等方式滿足相關(guān)要求,從而確保Multi-Die系統(tǒng)的可靠性。
采用UCIe標(biāo)準(zhǔn)的優(yōu)勢
試想一下這種情形:Multi-Die系統(tǒng)包含兩塊芯片,分別來自兩家不同的供應(yīng)商,并采用了不同的工藝技術(shù),比如7nm和3nm;而且,還需要這兩塊芯片能夠無縫地相互通信并支持行業(yè)標(biāo)準(zhǔn)協(xié)議,比如PCI Express(PCIe)和CXL等。要知道,在設(shè)計中每添加一塊芯片,系統(tǒng)的延遲就會增加,性能也會隨之降低。
要讓所有芯片協(xié)同工作,并克服延遲難題,需要遵循正確的標(biāo)準(zhǔn)。為Multi-Die系統(tǒng)采用UCIe標(biāo)準(zhǔn)具有以下幾個優(yōu)勢:
確保互操作性并降低延遲。選擇符合UCIe標(biāo)準(zhǔn)的接口IP可以實現(xiàn)芯片之間的無縫連接和互操作性,而又不會影響整個系統(tǒng)。將系統(tǒng)設(shè)計為符合UCIe標(biāo)準(zhǔn),可以在保持相同延遲的情況下降低功耗并提高性能。
借助冗余通道實現(xiàn)故障修復(fù)。UCIe規(guī)范在PHY的兩側(cè)之間提供了冗余通道,可以通過額外的通道實現(xiàn)故障修復(fù)。無論是否連接到外部環(huán)境,所有芯片都必須通過UCIe通道進行訪問、測試和修復(fù),同時UCIe通道還可以用于監(jiān)測正在發(fā)生的芯片問題。
為確保Multi-Die系統(tǒng)能夠長期正常工作,除了采用UCIe標(biāo)準(zhǔn)外,還需要從一開始就保證高質(zhì)量。鑒于Multi-Die系統(tǒng)的復(fù)雜性,不僅要在SoC的開發(fā)和制造過程中實現(xiàn)更高的質(zhì)量,還要在現(xiàn)場運行很長時間后繼續(xù)保持高質(zhì)量。為此,需要使用高質(zhì)量的構(gòu)建模塊(即芯片和IP)、硬件加速和驗證工具,并開展持續(xù)的測試和現(xiàn)場監(jiān)測(包括修復(fù)),從而主動解決各種潛在問題。
如何確保基于UCIe的Multi-Die系統(tǒng)穩(wěn)健運行
除了控制器和PHY IP外,以下是確保基于UCIe的Multi-Die系統(tǒng)穩(wěn)健運行的另外三項要求:
1. 使用協(xié)議驗證IP和硬件輔助驗證平臺,從一開始就保證質(zhì)量
在軟件仿真器上運行協(xié)議驗證IP解決方案,有助于從一開始就確保高質(zhì)量的UCIe組件和接口層,包括現(xiàn)場設(shè)備集成(FDI)上的協(xié)議層、原始Die-to-Die接口(RDI)上的PHY接口、中間適配層,或Die-to-Die適配器的實現(xiàn)。
隨著設(shè)計范圍擴大至全棧,涉及到多模塊芯片組配置和復(fù)雜的Multi-Die系統(tǒng)時,只靠純軟件仿真已經(jīng)難以滿足要求,需要運用更多工具來驗證整個系統(tǒng)或各個芯片。在對大型Multi-Die系統(tǒng)進行實際驗證時,硬件輔助驗證(HAV)平臺尤為關(guān)鍵,比如新思科技ZeBu硬件加速系統(tǒng)和新思科技HAPS原型系統(tǒng)。為涵蓋所有驗證用例(從早期的RTL開發(fā),到互操作性和硬件合規(guī)性驗證),多MHz周期性能、優(yōu)化的UCIe協(xié)議解決方案(事務(wù)處理器、速度適配器、硬件接口卡)和系統(tǒng)級調(diào)試抽象必不可少。
2. 通過測試確保互連性能符合預(yù)期
測試是所有芯片設(shè)計過程中的重要一環(huán)。在Multi-Die系統(tǒng)中,芯片之間的互連通常基于UCIe等接口。為確保按預(yù)期運行,這些互連中不得存在任何固定型故障、開路或短路。信號完整性非常重要,因此必須測量該參數(shù)以評估是否存在性能降級情況。UCIe標(biāo)準(zhǔn)要求具有額外的互連以實現(xiàn)冗余。鍵合后測試可以解決一些可能觸發(fā)切換互連通道的互連層面問題。在理解故障模型的基礎(chǔ)上開發(fā)的算法測試也可以用于評估互連缺陷。
3. 采用芯片生命周期管理策略
UCIe接口是Multi-Die系統(tǒng)中芯片之間進行功能通信的主要接口。由于UCIe接口以非常高的速度運行并且是通信的關(guān)鍵路徑,因此必須在整個生命周期內(nèi)對其進行監(jiān)測和管理。通過監(jiān)測UCIe的運行狀況,可以為汽車、醫(yī)療等領(lǐng)域的安全關(guān)鍵型應(yīng)用提供巨大幫助。例如,在自動駕駛汽車應(yīng)用中,通過對UCIe的運行狀況進行監(jiān)測,可以讓車主及時進行預(yù)防性維修,或者提醒車主到店維修,以防在高速道路上發(fā)生故障。
新思科技芯片生命周期管理(SLM)系列可在運行期間主動監(jiān)測UCIe接口,發(fā)現(xiàn)通道信號質(zhì)量下降,即在通道發(fā)生故障之前予以修復(fù)。此外,它還提供內(nèi)置自測(BIST),可檢測軟錯誤或硬錯誤以采取糾正措施。
結(jié)語
芯片設(shè)計正在發(fā)生轉(zhuǎn)變。為Multi-Die系統(tǒng)采用UCIe標(biāo)準(zhǔn)只是實現(xiàn)無縫連接和互操作性的第一步。要想駕馭先進Multi-Die系統(tǒng)設(shè)計中的復(fù)雜性,遵守UCIe標(biāo)準(zhǔn)中的要求是關(guān)鍵。如果想要進一步探索UCIe,或了解新思科技如何助力簡化Multi-Die系統(tǒng)設(shè)計流程,歡迎查閱新思科技官網(wǎng),或點擊“閱讀原文”,了解Multi-Die系統(tǒng)解決方案。
原文標(biāo)題:設(shè)計更簡單,運行更穩(wěn)健,UCIe標(biāo)準(zhǔn)如何“拿捏”Multi-Die系統(tǒng)?
文章出處:【微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
新思科技
+關(guān)注
關(guān)注
5文章
796瀏覽量
50334
原文標(biāo)題:設(shè)計更簡單,運行更穩(wěn)健,UCIe標(biāo)準(zhǔn)如何“拿捏”Multi-Die系統(tǒng)?
文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論