從2017年Google提出Transformer模型,再到去年ChatGPT的橫空出世,人們對深度學(xué)習(xí)能力邊界的認(rèn)知一次次被打破,人工智能(AI)似乎正在加速融入我們每個人的工作和生活。人們不再問AI能做什么,而是它不能做什么。從當(dāng)下熱門的ChatGPT等聊天機(jī)器人到自動駕駛汽車,AI已經(jīng)應(yīng)用到我們?nèi)粘I畹姆椒矫婷?。即便?a href="http://www.1cnz.cn/v/tag/137/" target="_blank">芯片設(shè)計這種過去視為可能不適用于AI的行業(yè),現(xiàn)在也受益于越來越智能的AI技術(shù)。
如果AI可以在芯片開發(fā)最耗時和耗力的環(huán)節(jié)助我們一臂之力,讓芯片設(shè)計更快地一次成功,那將是如何的景象?試想一下,假如我們將AI整合到芯片驗證和調(diào)試階段,尤其是在芯片只會越來越精密和復(fù)雜的當(dāng)下,又會帶來怎樣的變化。
當(dāng)然,應(yīng)用AI的最終目標(biāo)是找出更多錯誤,加速實現(xiàn)驗證覆蓋率目標(biāo)。數(shù)字設(shè)計存在巨大的設(shè)計狀態(tài)空間,要對所有這些空間進(jìn)行人工分析,并獲得足夠的可行見解用以改進(jìn)設(shè)計,幾乎是不可能完成的任務(wù)。
但如果AI能在這方面有效發(fā)揮作用,驗證開發(fā)者就可以專注于發(fā)現(xiàn)和修復(fù)錯誤。想想這對芯片設(shè)計會有多大幫助。
芯片設(shè)計的復(fù)雜性與日俱增,半導(dǎo)體行業(yè)正面臨著一系列重大挑戰(zhàn)。從發(fā)展埃米級設(shè)計到Multi-Die集成再到快速節(jié)點遷移,開發(fā)者從未如此迫切地希望提高開發(fā)效率,尋找創(chuàng)新的解決方案。然而,受限于邏輯和功能問題,大多數(shù)片上系統(tǒng)(SoC)都難以避免代價高昂的重新流片。正因如此,開發(fā)者需要盡可能全面地進(jìn)行SoC驗證。但是,由于成本和上市時間方面的壓力,開發(fā)者不可能一直反復(fù)運行驗證和調(diào)試循環(huán)。
芯片的RTL代碼設(shè)計完成以及設(shè)計狀態(tài)空間配置就緒后,便可啟動驗證流程。芯片驗證開發(fā)者需要逐一檢查這些空間,確保最終的SoC設(shè)計能夠正常運行。覆蓋率收斂的目的是確保整個設(shè)計能按預(yù)期的功能正常運行。
覆蓋率收斂流程存在三大挑戰(zhàn):
-
覆蓋率規(guī)劃。開發(fā)者很難確定測試平臺的覆蓋率定義中要寫哪些內(nèi)容(需要什么類型的coverage group,哪里有差距,還需要寫些什么等等)。確保實現(xiàn)100%覆蓋就表示所有的錯誤都已找到,這非常重要。
-
覆蓋率收斂。開發(fā)者很難確定什么測試用例對覆蓋最有用。開發(fā)者可能要運行同一個測試用例1000次,才能達(dá)到50%的覆蓋。隨著覆蓋率越來越接近100%,開發(fā)者會發(fā)現(xiàn),覆蓋剩下的幾個百分點可能需要幾周時間才能完成。直接用例是一種有效的覆蓋手段,但要投入大量的人力去開發(fā)。
-
激勵開發(fā)和根本原因分析。開發(fā)者可能會遇到激勵本不應(yīng)該執(zhí)行某個特定配置或錯誤的情況?;蛟S激勵的編寫方式導(dǎo)致其根本無法達(dá)到覆蓋目標(biāo)。
在傳統(tǒng)芯片驗證周期中,驗證開發(fā)者會設(shè)定一個目標(biāo)并運行其回歸環(huán)境。在此過程中,開發(fā)者會設(shè)置測試平臺來生成隨機(jī)激勵,從而觀察設(shè)計的響應(yīng)情況。一個設(shè)計運行10000到15000條用例十分常見,而且驗證團(tuán)隊往往對每條測試用例的ROI沒什么概念。回歸的運行可能長達(dá)數(shù)日,并占用寶貴的計算資源。
在SoC驗證周期中,有兩個迭代循環(huán)占用了大部分的時間,其一是在運行回歸后進(jìn)行故障調(diào)試與錯誤修復(fù),其二是覆蓋率收斂(圖1)。這兩項迭代工作都非常耗時,內(nèi)容包括覆蓋率分析、發(fā)現(xiàn)覆蓋漏洞后作出調(diào)整,以及一次又一次的重新再來。發(fā)現(xiàn)故障后,驗證團(tuán)隊需要對故障進(jìn)行分析,在RTL或測試平臺中進(jìn)行修改,并重新運行回歸,確保這些錯誤確實得到了修復(fù)。同樣,這部分工作也需要迭代循環(huán)。
圖1:典型驗證周期中的迭代循環(huán)。
此外,覆蓋率收斂流程最后的收尾工作通常最為棘手。對整個流程生成大量數(shù)據(jù)進(jìn)行全面的人工分析是不太可行的,因此團(tuán)隊一般都需要對芯片設(shè)計缺陷的根本原因有更多了解。
迭代循環(huán)有一個好處是可以從中學(xué)習(xí),因此AI,尤其是機(jī)器學(xué)習(xí)(ML),正好派上用場。如果ML引擎能夠從某些模式中學(xué)習(xí),便能夠完成相應(yīng)工作,比如從測試平臺的一行代碼中識別出可能的錯誤。學(xué)到相應(yīng)知識后,它就能將這種洞察應(yīng)用于未來的回歸,從而加快覆蓋收斂速度,尤其是隨著系統(tǒng)不斷得到訓(xùn)練,也許還能提高覆蓋水平。
AI在半導(dǎo)體行業(yè)的應(yīng)用已經(jīng)取得了顯著進(jìn)展。新思科技屢獲殊榮的DSO.ai芯片設(shè)計AI應(yīng)用最近率先實現(xiàn)了首個100次生產(chǎn)流片。DSO.ai可以自動搜索芯片設(shè)計大型解決方案空間中的優(yōu)化目標(biāo),有助于提高開發(fā)效率并改善芯片的功耗、性能和面積(PPA)。
在驗證方面,為了縮短調(diào)試和修復(fù)的周期,新思科技推出了采用回歸調(diào)試自動化(RDA)技術(shù)的Verdi自動調(diào)試系統(tǒng)等解決方案,為開發(fā)者帶來AI驅(qū)動的芯片驗證工具。通過這一功能,開發(fā)者可以利用預(yù)測性分析,讓容易出錯的人工流程實現(xiàn)自動化,更輕松地找到被測設(shè)計和測試平臺故障的根本原因。更多助力實現(xiàn)調(diào)試自動化的創(chuàng)新方案即將推出,最終將把調(diào)試和修復(fù)循環(huán)變成一個無需人工干預(yù)的全自動化流程。
這些應(yīng)用僅僅是一個開始,未來必將會有更多應(yīng)用。在越來越多的EDA流程中,愈發(fā)智能的AI技術(shù)有助于開發(fā)者提高工作效率,取得更好的成效。例如,AI幫助開發(fā)者更好地了解還需要其它哪些覆蓋、越來越智能的AI技術(shù)有助于最大限度地減少回歸運行的時間和精力,以及AI有助于加快根本原因分析,等等?;蛟S,原本需要長達(dá)數(shù)日的任務(wù),在AI技術(shù)的幫助下只要幾個小時便可完成,節(jié)省下來的資源就可以用來開發(fā)其它項目,或者完成更多的增值任務(wù)。
我們的世界充斥著各種復(fù)雜問題,解決這些問題需要更加復(fù)雜的計算系統(tǒng)來處理。自動化和智能化可以完善開發(fā)者的工作,有助于開發(fā)者提高工作效率,讓設(shè)計和驗證開發(fā)者專注于打造差異化的芯片,推動這樣的計算系統(tǒng)問世。如果AI驅(qū)動的EDA流程可以承擔(dān)重復(fù)性任務(wù),開發(fā)者就有更多精力來處理錯誤修復(fù)并進(jìn)一步推進(jìn)他們的設(shè)計。從設(shè)計空間探索到覆蓋率和調(diào)試周期等,AI必將對諸多領(lǐng)域產(chǎn)生深遠(yuǎn)的影響。
-
新思科技
+關(guān)注
關(guān)注
5文章
796瀏覽量
50334
原文標(biāo)題:AI如何顛覆傳統(tǒng)芯片驗證方式?
文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論