由于仿真軟件需要耗費大量計算資源,許多計算機輔助工程 (CAE) 應(yīng)用都可以從 GPU 的并行處理能力中大受裨益。與 CPU 相比,GPU 的密度更高而總體擁有成本更低,因此具有明顯的性價比優(yōu)勢,今天為大家分享基于CFD領(lǐng)域的GPU加速體驗。
計算流體仿真力學(xué),英文全稱Computational Fluid Dynamics,縮寫為CFD,它是數(shù)值數(shù)學(xué)和計算機科學(xué)結(jié)合的產(chǎn)物,通過空間離散和數(shù)值求解的思路,對流體力學(xué)的各類問題進(jìn)行數(shù)值實驗、模擬和分析研究,以解決學(xué)習(xí)、科研或者工程設(shè)計中的問題。
面對一個具體的工程問題,CFD工程師在應(yīng)用CFD工具進(jìn)行仿真分析時的基本流程,通常可以總結(jié)為五步:前處理、網(wǎng)格劃分、邊界條件加載、求解計算和后處理。但如何去平衡計算量(網(wǎng)格數(shù)量)和計算時間,對于很多CFD工程師都是個挑戰(zhàn)。
在實際解決問題的過程中,CFD工程師除了希望能選擇一款稱手的軟件工具外,當(dāng)然也希望計算機的主頻越高越好,核心越多越好。但是,核心與計算速度并非線性關(guān)系,不會因為核心等比例增長。若想在單臺電腦上發(fā)揮極限運算能力,還需要使用GPU加速,因為GPU加速通過協(xié)調(diào)處理器并行運算,能夠極大地提升計算能力,尤其適合多個項目同時進(jìn)行,這樣獲得的時間收益較大。
流體仿真為什么要選擇GPU?
CFD始終向處理更高精確度、更復(fù)雜的幾何結(jié)構(gòu)方向發(fā)展。但現(xiàn)階段,CFD軟件應(yīng)用于復(fù)雜流體問題方面還有待拓展,受到的阻礙主要源自以下三個方面:
● 隱式算法的高內(nèi)存要求——一些CFD分析工程師總是希望得到完美的殘差收斂曲線,以證明計算結(jié)果的可靠性,因此,他們會首選隱式算法,這意味著高內(nèi)存的需求;
● CFD結(jié)果對網(wǎng)格的強依賴性——網(wǎng)格的合理設(shè)計和高質(zhì)量生成是CFD計算的前提條件,是影響CFD計算結(jié)果的最主要的決定性因素之一,是CFD工作中人工工作量最大的部分,也是制約CFD工作效率的瓶頸問題之一。即使在CFD高度發(fā)達(dá)的國家,網(wǎng)格生成仍占整個CFD計算任務(wù)全部人力時間的70%~80%。
● 工程流體仿真問題復(fù)雜多變——在流體力學(xué)模擬中,由于流體力學(xué)模擬是個復(fù)雜的過程,存在極端變形、自由液面以及物質(zhì)運動交界面等問題,在應(yīng)用網(wǎng)格數(shù)值模擬時,會出現(xiàn)網(wǎng)格扭曲導(dǎo)致計算不收斂或者產(chǎn)生很大的計算誤差,需要重新模擬,這使得計算成本大大增加。
為了使CFD仿真發(fā)揮最大效用,CFD工程師往往需要快速得到計算結(jié)果。而借助于GPU加速計算所提供的非凡應(yīng)用程序性能,能將CFD程序計算密集部分的工作負(fù)載轉(zhuǎn)移到GPU,同時仍有CPU運行其余程序代碼,這樣計算速度大大提升。另外,從計算性能來看,在CFD應(yīng)用中單個GPU的性能遠(yuǎn)遠(yuǎn)優(yōu)于CPU,基于GPU加速的CFD計算速度明顯加快,很多復(fù)雜的CFD難題得以解決,因此,越來越多的CFD工程師選擇GPU加速。
流體仿真分析GPU評測
CFD是一個計算需求強烈的領(lǐng)域,GPU的選擇將從根本上決定CFD分析過程的體驗。在CFD分析中,工程師前期花費的時間主要在模型建立和修改上,后期真正的分析時間消耗在計算機上,因此,選擇一款適合自身的CFD軟件和高性能建模工作站就顯得尤為重要。接下來分享來自e-works平臺基于Altair CFD應(yīng)用軟件以及一些案例模型的實際評測,供大家參考:
基于Altair AcuSolve軟件的 GPU加速
【軟件環(huán)境介紹】Altair AcuSolve是一款基于GLS-FEM算法的通用熱流體求解器,不但有快速良好的收斂速度,還能達(dá)到很高的求解精度,同時對網(wǎng)格有良好的兼容性,特別方便于復(fù)雜模型網(wǎng)格的劃分,廣泛應(yīng)用于汽車、流體機械和海洋平臺等工業(yè)和科學(xué)應(yīng)用問題的解決。值得一提的是,最新版本的AcuSolve,不僅通過GPU加速提高了3~4倍的計算速度,同時也支持核態(tài)沸騰、熱輻射、冷凝/蒸發(fā)多相流和流固耦合(FSI)等CFD難題的解決。
【硬件環(huán)境介紹】CPU采用單顆Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU選用Quadro RTX 8000,它采用了NVIDIA Turing架構(gòu)和NVIDIA RTX平臺支持,對于追求以高穩(wěn)健性、高精度為目標(biāo)的CFD仿真分析帶來了卓越的計算性能體驗。
【測試模型】在新能源汽車、醫(yī)療設(shè)備、軍工設(shè)備等大功率密度的應(yīng)用場合,設(shè)備運行時會產(chǎn)生大量的熱損耗,為保證設(shè)備的安全運行,需要采用各種冷卻措施來對設(shè)備進(jìn)行冷卻,水冷是其中一種方式。以新能源車的水冷板為例,其設(shè)計直接影電池的溫度均勻性,進(jìn)而影響車輛的續(xù)航里程和安全性。本測試模型擁有網(wǎng)格數(shù)量4300萬,求解方程采用湍流+固體傳熱組合,湍流模型選擇基于SA一方程的模型,設(shè)置穩(wěn)態(tài)迭代步為200步,分別采用無GPU和1塊GPU加速進(jìn)行計算時間對比。
動力電池水冷板模型
計算時間對比
【測試結(jié)果】數(shù)據(jù)表明,無GPU加速時,水冷板分析的計算時間需要21小時;采用單塊Quadro RTX 8000加速,水冷板分析的計算時間只需要4小時。由此可見,采用Altair AcuSolve進(jìn)行水冷板仿真分析,并提供RTX GPU的增強支持,計算速度與無GPU加速相比提高了4.25倍。顯然,這種方式對于CFD工程師快速探索水冷板的設(shè)計,并根據(jù)準(zhǔn)確的計算結(jié)果做出決策非常有益。
基于Altair nanoFluidX軟件的 GPU加速
【軟件環(huán)境介紹】Altair nanoFluidX是一款基于粒子的流體動力學(xué) (SPH) 仿真工具,用于預(yù)測運動軌跡復(fù)雜的幾何結(jié)構(gòu)周圍的流體。以整車CFD仿真為例,傳統(tǒng)CFD方法需要建立網(wǎng)格耗時巨大,但Altair nanoFluidX基于粒子的特性,無需建立網(wǎng)格,還可基于GPU顯卡計算,非常有助于工程師獲得簡潔而高效的CFD解決方案。
【硬件環(huán)境介紹】CPU采用單顆Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU選用Quadro RTX 8000和Tesla V100,由于Altair nanoFluidX采用的粒子方法,其計算是由一系列的流體粒子的相互作用完成,在計算中每個粒子所執(zhí)行的計算是完全相同的,而在不同的數(shù)據(jù)上執(zhí)行相同的程序,恰恰是GPU計算最擅長的。
【測試模型】整車涉水分析是近年來新興的CFD仿真領(lǐng)域,主要研究汽車以一定速度涉水時,關(guān)鍵零部件的進(jìn)水風(fēng)險,如防火墻滲水,傳統(tǒng)的發(fā)動機進(jìn)氣口進(jìn)水,電動汽車電氣短路等問題。整車涉水模型往往需要消耗大量的計算資源和時間進(jìn)行求解,以本次建立的整車涉水模型為例,擁有粒子數(shù)量為4100萬,設(shè)置車速為50公里/小時、瞬態(tài)物理時間為4秒,建立單相流模型,本次測試分別采用1塊RTX 8000 、2塊RTX 8000、4塊RTX 8000和4塊Tesla V100加速,對比計算時間。
整車涉水模型
計算時間對比
【測試結(jié)果】數(shù)據(jù)表明,采用1塊、2塊、4塊RTX 8000加速,整車涉水分析分別需要花費48小時、28小時、13小時;采用4塊V100,則需要16個小時。從計算時間來看,采用4塊RTX 8000加速,計算時間最少,與采用1塊RTX 8000加速相比,計算速度提升了約2.7倍。計算結(jié)果也表明,采用基于GPU加速和Altair nanoFluidX的組合方式,允許CFD工程師在一個更可接受的短時間內(nèi)研究類似整車涉水這樣的復(fù)雜流體問題。
基于Altair ultraFluidX軟件的 GPU加速
【軟件環(huán)境介紹】Altair ultraFluidX專用于超快預(yù)測乘用車、輕型卡車、賽車和重型車輛的空氣動力特性的仿真分析,它基于格子玻爾茲曼(LBM)技術(shù),無需建立網(wǎng)格,這大大縮短了建模時間,使得設(shè)計變得更加容易,同時保留了所有重要的幾何細(xì)節(jié)。
【硬件環(huán)境介紹】CPU采用單顆Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU選用NVIDIA RTX8000和NVIDIA Tesla V100,由于Altair ultraFluidX采用的LBM方法,非常適合大規(guī)模并行架構(gòu),而采用GPU加速,可以明顯提高吞吐量,達(dá)到Altair ultraFluidX的周轉(zhuǎn)時間,同時降低硬件和能源成本。
【測試模型】對于車輛的早期開發(fā)優(yōu)化,采用CFD手段無疑是最有效且最經(jīng)濟(jì)的方法,但這類CFD分析往往是高內(nèi)存和高計算資源消耗的典型代表,需要使用GPU來優(yōu)化計算性能。以此次建立的汽車虛擬風(fēng)洞模型為例,擁有格子數(shù)量1億6千萬,格子的最小尺寸為1.8mm,設(shè)置車速為140公里/小時、瞬態(tài)物理時間為2秒,分別采用2塊NVIDIA RTX 8000、4塊NVIDIA RTX 8000和4塊V100加速,對比計算時間。
汽車虛擬風(fēng)洞模型
計算時間對比
【測試結(jié)果】數(shù)據(jù)表明,采用2塊、4塊NVIDIA RTX8000加速,模擬汽車虛擬風(fēng)洞分別需要花費14小時、8小時;采用4塊V100,則需要8.4個小時。三種GPU加速中,采用4塊NVIDIA RTX8000加速,計算時間最少,與采用2塊NVIDIA RTX8000加速相比,計算速度提升了約0.75倍。計算結(jié)果也表明,基于GPU和Altair ultraFluidX的組合方式,可以明顯加速汽車虛擬風(fēng)洞分析,有效縮短汽車開發(fā)周期。
總結(jié)
作為當(dāng)前最重要的三大協(xié)處理加速技術(shù)之一,GPU已經(jīng)成為數(shù)值分析的新寵,廣泛應(yīng)用于各個領(lǐng)域。以流體仿真領(lǐng)域為例,隨著CFD分析對計算能力的要求日益增高,越來越多的CFD工程師傾向于采用GPU加速,例如借助 RTX 8000 GPU加速,能以遠(yuǎn)低于傳統(tǒng) CPU 解決方案的成本、空間和功耗,獲得無與倫比的計算性能。
同時,在渲染方面,利用RTX 8000強大的運算能力,將流場和流體構(gòu)件建立數(shù)學(xué)模型,并用數(shù)字化可視化的形式表現(xiàn)出來,可以獲得任意位置的結(jié)果值,這無疑也極大地提高了設(shè)計的精確性。e-works認(rèn)為,優(yōu)秀的計算性能和尖端的數(shù)值方法的組合,在更短的時間內(nèi)研究復(fù)雜的流體問題,將成為未來CFD領(lǐng)域高效而主流的方式。
編輯:hfy
-
gpu
+關(guān)注
關(guān)注
28文章
4735瀏覽量
128919 -
CFD
+關(guān)注
關(guān)注
1文章
116瀏覽量
18400
發(fā)布評論請先 登錄
相關(guān)推薦
評論