作為最早的電子設(shè)計自動化軟件,我們的EDA云實證系列從SPICE開始,再合適不過。
在它出現(xiàn)之前,人們分析電路,用的是紙筆或者搭電路板。隨著電路規(guī)模增大,手工明顯跟不上。
于是,1971年,SPICE誕生了。全稱“Simulation Program with Integrates Circuit Emphasis"。
H-SPICE是隨著產(chǎn)業(yè)環(huán)境及電路設(shè)計技術(shù)的發(fā)展與升級,以“SPICE2”為基礎(chǔ)加以改進(jìn)而成的商業(yè)軟件產(chǎn)品,現(xiàn)在屬于Synopsys。
既然有了新的計算機(jī)輔助工具,那問題就來了:
怎么才能跑得更快一點?
怎么才能運(yùn)行更大規(guī)模的集成電路?
第一個答案是算法改進(jìn)。這屬于數(shù)學(xué)領(lǐng)域,很難。
第二個答案是摩爾定律。從上世紀(jì)70年代初到如今,SPICE從只能仿真十幾個元器件到今天可以仿真上千萬個元器件的電路。但已經(jīng)幾十年沒有太大的變化了。
第三個答案是計算架構(gòu)升級,從單核到多核,單線程到多線程。
第四個答案是Cloud HPC云端高性能計算。談概念過于抽象,我們今天拿實證說話。
實證背景信息
用戶需求
作為一家純IC設(shè)計公司,C社成立已超過十年。
公司在本地部署了由十多臺機(jī)器組成的計算集群,但目前面臨的最大問題依然是算力不足。特別是面對每年十次左右的算力高峰期時,基本上沒有太好的辦法。
對云的認(rèn)知
C社相關(guān)負(fù)責(zé)人表示:算力不足是目前IC設(shè)計行業(yè)普遍面臨的問題。對于EDA上云,公司之前沒有嘗試過,對云模式和架構(gòu)也并不了解,在數(shù)據(jù)安全性方面也存在一定的顧慮。
不過該負(fù)責(zé)人對于EDA上云早有耳聞,也頗感興趣,愿意進(jìn)行一定的嘗試。畢竟上云若真的能夠加快運(yùn)算速度,就意味著可以更早展開研究,從而提升項目的整體進(jìn)度。
實證目標(biāo)
1、HSPICE任務(wù)能否在云端運(yùn)行?
2、云端資源是否能適配HSPICE任務(wù)需求?
3、fastone平臺能否有效解決目前業(yè)務(wù)問題?
4、相比傳統(tǒng)手動模式,云端計算集群的自動化部署,有哪些好處?
實證參數(shù)
平臺:
fastone企業(yè)版產(chǎn)品
應(yīng)用:
HSPICE
適用場景:
仿真模擬電路、混合信號電路、精確數(shù)字電路、建立SoC的時序及功耗單元庫、分析系統(tǒng)級的信號完整性等
技術(shù)架構(gòu)圖:
用戶登錄VDI,使用fastone算力運(yùn)營平臺根據(jù)實際計算需求自動創(chuàng)建、銷毀集群,完成計算任務(wù)。
License配置:
EDA License Server設(shè)置在本地。
步驟一:硬件選擇
選擇適合HSPICE應(yīng)用的配置
云端可以選擇的機(jī)型有幾百種,配置、價格差異極大。
我們首先需要挑選出既能滿足HSPICE應(yīng)用需求,又具備性價比的機(jī)型。
已知用戶的本地硬件配置:
Xeon(R) Gold 6244 CPU @ 3.60GHz,512GB Memory
本地配置不僅主頻高,內(nèi)存也相當(dāng)大。
我們推薦的云端硬件配置:
96 vCPU, 3.6GHz, 2nd Gen Intel Xeon Platinum 8275CL, 192 GiB Memory
推薦理由:
1、該應(yīng)用對CPU主頻要求較高,但內(nèi)存要求并不大;
2、我們選擇了計算優(yōu)化型云端實例,即具備高性價比的高主頻機(jī)器。
C社的本地硬件在HSPICE以外,還需處理一些需要大內(nèi)存的后端任務(wù),所以需要在配置上兼顧各種資源需求,在當(dāng)前項目不可避免會造成一定的資源浪費(fèi)。
步驟二:云端部署
手動模式 VS 自動部署
我們先看手動模式:
第一步:不管你需要用哪朵云,你都得先熟悉那家云的操作界面,掌握正確的使用方法;
第二步:構(gòu)建大規(guī)模算力集群:
配置計算節(jié)點,存儲節(jié)點,VPC,安全組等等
安裝應(yīng)用,把HSPICE安裝在集群環(huán)境
配置集群調(diào)度器,比如slurm
第三步:上傳任務(wù)數(shù)據(jù),開啟計算;
第四步:任務(wù)完成后及時下載結(jié)果并關(guān)機(jī)。
不要笑,這一點很重要。我們在切換七種視角,我們給各位CXO大佬算算上云這筆賬有講到原因。
此外,還有一個需要考慮的點,時間。
第一步,需要多少時間說不好;
第二步,大概需要專業(yè)IT人員平均3-5天;
第三步/第四步,如果數(shù)據(jù)量較大,需要考慮斷點續(xù)傳和自動重傳;
第四步,任務(wù)完成時間很可能難以預(yù)測。
即使是可測的,我們可以想象一個場景——有個任務(wù)預(yù)計在凌晨跑完,用戶此時有兩個選擇:
1、調(diào)一個鬧鐘,半夜起來關(guān)機(jī)——有人遭罪;
2、睡到自然醒,次日上班關(guān)機(jī)——成本浪費(fèi)。
在手動模式下,通常都是先構(gòu)建一個固定規(guī)模的集群,然后提交任務(wù),全部任務(wù)結(jié)束后,關(guān)閉集群。
想一下一個幾千core的集群拉起來之后,第二、三、四步手動配置的時間里,所有機(jī)器一直都是開啟狀態(tài),也就是說,燒錢中。
再看看我們的自動化部署:
第一步,不需要;
第二步,只需要點擊幾個按鈕,5-10分鐘即可開啟集群;
第三步,我們有Auto-Scale功能,自動開關(guān)機(jī)。
另外,我們還自帶資源的管理和監(jiān)控功能。
fastone的Auto-Scale功能可以自動監(jiān)控用戶提交的任務(wù)數(shù)量和資源的需求,動態(tài)按需地開啟所需算力資源,在提升效率的同時有效降低成本。
所有操作都是自動化完成,無需用戶干預(yù);
在實際開機(jī)過程中,可能遇到云在某個可用區(qū)資源不足的情況,fastone會自動嘗試從別的區(qū)域開啟資源;
如果需要的資源確實不夠,又急需算力完成任務(wù),用戶還可以從fastone界面選擇配置接近的實例類型來補(bǔ)充。
跨區(qū)域,跨機(jī)型使用,在本次實證場景沒有用到。
我們還可以根據(jù)GPU的需求來實現(xiàn)自動伸縮,下次單獨聊。
實證場景一:云端驗證
本地40核 VS 云端40核 VS云端80核
結(jié)論:
1、當(dāng)計算資源與任務(wù)拆分方式均為5*8核時,本地和云端的計算周期基本一致;
2、在云端將任務(wù)拆分為10*4核后,比5*8核的拆分方式計算周期減少三分之一;
3、當(dāng)任務(wù)拆分方式不變,計算資源從40核增加到80核,計算周期減半;
4、當(dāng)計算資源翻倍,且任務(wù)拆分方式從5*8核變更為10*4核后,計算周期減少三分之二;
5、fastone自動化部署可大幅節(jié)省用戶的時間和人力成本。
實證過程:
1、本地使用40核計算資源,拆分為5*8核,運(yùn)行編號為1的HSPICE任務(wù),耗時42小時;
2、云端調(diào)度40核計算資源,拆分為5*8核,運(yùn)行編號為1的HSPICE任務(wù),耗時42小時;
3、云端調(diào)度40核計算資源,拆分為10*4核,運(yùn)行編號為1的HSPICE任務(wù),耗時28小時;
4、云端調(diào)度80核計算資源,拆分為10*8核,運(yùn)行編號為1的HSPICE任務(wù),耗時21小時;
5、云端調(diào)度80核計算資源,拆分為20*4核,運(yùn)行編號為1的HSPICE任務(wù),耗時14小時。
實證場景二:大規(guī)模業(yè)務(wù)驗證
超大規(guī)模計算任務(wù)
結(jié)論:
1、增加計算資源并優(yōu)化任務(wù)拆分方式后,云端調(diào)度1920核計算資源,將一組超大規(guī)模計算任務(wù)(共計24個HSPICE任務(wù))的計算周期從原有的30天縮短至17小時即可完成,云端最優(yōu)計算周期與本地計算周期相比,效率提升42倍;
2、由fastone平臺自研的Auto-Scale功能,使平臺可根據(jù)HSPICE任務(wù)狀態(tài)在云端自動化構(gòu)建計算集群,并根據(jù)實際需求自動伸縮,計算完成后自動銷毀,在提升效率的同時有效降低成本;
3、隨著計算周期的縮短,設(shè)備斷電、應(yīng)用崩潰等風(fēng)險也相應(yīng)降低,作業(yè)中斷的風(fēng)險也大大降低。在本實例中未發(fā)生作業(yè)中斷。
實證過程:
1、本地使用40核計算資源,拆分為5*8核,運(yùn)行編號從0到23共計24個HSPICE任務(wù),耗時約30天;
2、云端調(diào)度1920核計算資源,拆分為24組,每組為20*4核,運(yùn)行編號從0到23共計24個HSPICE任務(wù),耗時17個小時。
實證小結(jié)
我們回顧一下實證目標(biāo):
1、HSPICE任務(wù)在云端能高效運(yùn)行;
2、異構(gòu)的云端資源能更好適配HSPICE任務(wù)需求,避免資源浪費(fèi);
3、fastone平臺有效解決了算力不足問題,效率提升42倍;
4、相比手動模式,fastone平臺自研的Auto-Scale功能,既能有效提升部署效率,降低部署門檻,又能大大縮短整個計算周期資源占用率,節(jié)約成本。
至于本次實證場景沒用到的跨區(qū)域,跨機(jī)型使用,還有根據(jù)GPU的需求來實現(xiàn)自動伸縮,我們下次再聊。
本次半導(dǎo)體行業(yè)Cloud HPC實證系列Vol.1就到這里了。
審核編輯 :李倩
-
仿真
+關(guān)注
關(guān)注
50文章
4160瀏覽量
134521 -
hspice
+關(guān)注
關(guān)注
6文章
30瀏覽量
24360 -
自動化軟件
+關(guān)注
關(guān)注
0文章
20瀏覽量
6083
原文標(biāo)題:從30天到17小時,如何讓HSPICE仿真效率提升42倍?
文章出處:【微信號:FPGA_Study,微信公眾號:FPGA自習(xí)室】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
FPC布線優(yōu)化:讓你的設(shè)計效率提升10倍

評論