在邊緣計算、Chiplet、人工智能和機器學(xué)習(xí)、CaaS(容器即服務(wù))以及可持續(xù)性發(fā)展的推動下,高性能計算變得越來越重要。
高性能計算(HPC)的概念在過去幾年中不斷發(fā)展,無論是在其嚴格的定義方面,還是如何使用它。如今,HPC 不再局限于大型數(shù)據(jù)中心、研究實驗室和超級計算機,而是在各個行業(yè)中用于產(chǎn)品設(shè)計、財務(wù)建模、天氣預(yù)報等任務(wù)。它已經(jīng)滲透到更接近我們?nèi)粘I畹膽?yīng)用程序中,它能夠?qū)⒏鼜姶蟮挠嬎銠C功能帶入我們依賴和享受的家庭、辦公室和汽車體驗中。
HPC 增長和擴展的根本原因可以歸結(jié)為一個詞:數(shù)據(jù)。因為其中有更多數(shù)據(jù)需要比以往更快地處理、分析和移動。高性能計算解決了更多數(shù)據(jù)產(chǎn)生、服務(wù)和消費無限循環(huán)——無論是智能家居的多服務(wù)流媒體習(xí)慣、日益互聯(lián)的汽車,還是我們完成工作、監(jiān)控我們的健康或管理我們的財務(wù)所需的信息量。
隨著對 HPC 需求的增長,對更快、更強大、更高效的半導(dǎo)體的需求同步攀升。事實上,盡管芯片業(yè)務(wù)的整體起伏不定,但HPC行業(yè)仍實現(xiàn)了持續(xù)和可持續(xù)的增長。那么,2023 年高性能計算的未來是什么?
邊緣(分布式)計算的增長
毫無疑問,邊緣計算是改變計算格局的關(guān)鍵發(fā)展趨勢,但它似乎與傳統(tǒng)HPC相差較多。高性能計算往往與大型集中式計算和存儲資源相關(guān)聯(lián),而這些資源實際上是基于云的遠程計算的支柱。相比之下,邊緣計算以處理網(wǎng)絡(luò)邊緣或附近的數(shù)據(jù)為中心,而不是將其一直發(fā)送回中心位置。通過這種方式,它可以提供更低的延遲,并且在許多情況下可以提供更安全的操作特性。
邊緣計算與傳統(tǒng)計算正在融合。由于數(shù)據(jù)的爆炸式增長,在邊緣生成的數(shù)據(jù)量在數(shù)量和復(fù)雜性方面呈指數(shù)級增長,包括由智能化需求推動的各種物聯(lián)網(wǎng) (IoT) 設(shè)備。邊緣計算主要用于延遲和內(nèi)容,因為往返云/集中式數(shù)據(jù)中心的往返將無法滿足所需的響應(yīng)時間。在某些情況下,文件太大,無法發(fā)送到云進行處理甚至存儲。這可能影響城市交通管理和相關(guān)的自動駕駛系統(tǒng)、精準醫(yī)療、欺詐檢測、商業(yè)智能、智能城市開發(fā)等。
邊緣計算將對 HPC 系統(tǒng)供應(yīng)商、云服務(wù)提供商、網(wǎng)絡(luò)和存儲供應(yīng)商產(chǎn)生重大影響,因為組織希望將遠程 HPC 功能與本地生成和處理的數(shù)據(jù)策略相結(jié)合。作為其中的一部分,還希望看到HPC的物理足跡從集中式交付模型擴展到更加分布式的方法,其中包括靠近大量數(shù)據(jù)生成邊緣站點的位置。
從芯片設(shè)計來看,邊緣計算雖然仍然需要最佳的功耗、性能和面積(PPA),但仍然具有另一個關(guān)鍵優(yōu)先事項:減少這些設(shè)備處理和數(shù)據(jù)傳輸?shù)难舆t。設(shè)計策略必須優(yōu)先考慮這些IC的數(shù)據(jù)傳輸速度和效率,例如下面討論的Chiplet架構(gòu)。當(dāng)然,芯片設(shè)計解決方案必須考慮PPA權(quán)衡方案的所有方面,并提供高級功能來設(shè)計和分析針對任何給定應(yīng)用要求的優(yōu)化IC。這包括強大的仿真和驗證工具、功耗和熱分析功能、設(shè)計布局的智能實現(xiàn),以及一系列用于關(guān)鍵功能和接口的認證 IP 模塊。展望未來,我們將看到從數(shù)據(jù)中心到電池供電的物聯(lián)網(wǎng)設(shè)備對能夠降低功耗的設(shè)計解決方案的需求不斷增加。
Chiplet成熟
HPC的最新趨勢之一是使用多芯片系統(tǒng)。多芯片系統(tǒng)在高性能計算領(lǐng)域獲得了青睞,作為保持摩爾定律(由于器件物理和制造傳統(tǒng)單片硅架構(gòu)的經(jīng)濟挑戰(zhàn)而放緩)走上正軌的一種方式。簡而言之,傳統(tǒng)的單片片上系統(tǒng)(SoC)變得過于龐大和昂貴,無法用于高級設(shè)計,并且良率風(fēng)險隨著設(shè)計尺寸的增加而增加。多芯片方法作為擴展摩爾定律的PPA優(yōu)勢的可行方法很有吸引力,無需增加芯片面積或功耗即可提供更多的處理能力。它們還支持異構(gòu)混合搭配方法,以最大限度地利用目標應(yīng)用優(yōu)化的工藝技術(shù)。分解 SoC 組件,單獨制造它們,然后將這些不同的功能整合到單個封裝中,從而減少浪費,同時提供一種快速創(chuàng)建具有優(yōu)化系統(tǒng)功耗和性能的新產(chǎn)品變體的方法。
雖然多芯片系統(tǒng)完全有能力成為 HPC 的基本推動因素,但設(shè)計方法必須不斷發(fā)展以應(yīng)對新的挑戰(zhàn)。例如,支持高帶寬、低延遲、高能效和無差錯性能的芯片到芯片接口對于快速、可靠的數(shù)據(jù)傳輸至關(guān)重要。需要增強的工具、方法和 IP 來處理這種多芯片方法引起的異構(gòu)集成、互連和封裝問題。先進封裝和硅光子學(xué)等領(lǐng)域的其他專業(yè)知識和技術(shù)對于推動創(chuàng)新和設(shè)計效率達到新的水平非常重要。
人工智能和機器學(xué)習(xí)的擴展范圍
另一個貫穿 HPC 各個方面的重要趨勢是人工智能 (AI) 和機器學(xué)習(xí)的興起。這是 HPC 享有共生關(guān)系的領(lǐng)域。
一方面,高性能計算機需要為人工智能工作負載提供動力,這在當(dāng)今自動化數(shù)據(jù)密集型世界中無處不在。對于HPC供應(yīng)商來說,這是一個快速增長的領(lǐng)域,他們幾乎在有計算需求的地方看到了新的機會。但是,為了支持AI工作負載,計算平臺需要不斷改進底層硬件的性能,這給芯片設(shè)計人員帶來了不斷創(chuàng)新的壓力。在這里,人工智能也與支持人工智能的設(shè)計工具一起發(fā)揮作用,現(xiàn)在用于通過優(yōu)化復(fù)雜或過于詳細的任務(wù)來處理尖端芯片設(shè)計的復(fù)雜性和規(guī)模,這些任務(wù)可以最好地由訓(xùn)練有素的人工智能算法處理。這不僅提高了整體工程效率,而且使設(shè)計師能夠?qū)W⒂诟嘁詣?chuàng)新為導(dǎo)向的工作。
另一方面,高性能計算依賴于人工智能本身來高效安全地運行數(shù)據(jù)中心。無論是監(jiān)控存儲、服務(wù)器和網(wǎng)絡(luò)設(shè)備的運行狀況和安全性,確保正確配置,預(yù)測設(shè)備故障,以及篩選惡意軟件數(shù)據(jù),AI 都能為 HPC 用戶提供更高水平的洞察力和預(yù)測性維護。人工智能還可用于通過優(yōu)化加熱和冷卻系統(tǒng)來減少電力消耗并提高效率,這是數(shù)據(jù)中心運營商最關(guān)心的關(guān)鍵可持續(xù)性問題。
高性能計算系統(tǒng)案例
隨著業(yè)務(wù)各個方面所需的計算能力的大幅提高,許多公司正在尋求“即服務(wù)”模型的價值,以滿足其周期性計算需求。輸入 HPC 即服務(wù) (HPCaaS),除了峰值工作負載效率之外,此類模型還為沒有內(nèi)部知識、資源或基礎(chǔ)設(shè)施的公司提供服務(wù)和支持,無法通過云利用 HPC。HPCaaS 使 HPC 容量易于部署、擴展,并且從成本角度來看更具可預(yù)測性。
在IC設(shè)計領(lǐng)域,人們對這種模型非常感興趣,該模型可以訪問執(zhí)行數(shù)據(jù)密集型芯片設(shè)計任務(wù)所需的計算資源。由多核架構(gòu)組成的復(fù)雜 HPC IC 設(shè)計就是一個很好的例子。它們需要增加計算、存儲和處理以進行設(shè)計和開發(fā)。通常需要并行處理大量數(shù)據(jù),以實現(xiàn)這些類型設(shè)計的設(shè)計和驗證的收斂。這種托管模型正在被大型半導(dǎo)體公司和初創(chuàng)公司使用,這些公司和初創(chuàng)公司正在為HPC開發(fā)高性能芯片,這是一種有趣的共生關(guān)系,HPC的推動者也取決于其功能。
與其他 HPCaaS 企業(yè)用途一樣,基于云的 EDA 在 IC 開發(fā)過程中提供了可擴展性、靈活性、生產(chǎn)力和安全性。公司可以根據(jù)特定的使用需求、高峰設(shè)計時間和分布式工作結(jié)構(gòu)調(diào)整 HPC 訪問,所有這些都不需要專門的資源管理專業(yè)知識。所有這些好處都與性能吞吐量優(yōu)勢相提并論,這是對 EDA 工具的關(guān)鍵需求。
可持續(xù)發(fā)展成為舞臺中心
盡管我們以最快的速度改進了 HPC 功能,并在生活的許多方面擴展了收益,但正在為這些耗電系統(tǒng)對環(huán)境的影響付出代價。一些專家預(yù)測,到2030年,僅數(shù)據(jù)中心就將消耗全球3%至7%的電力。在地方層面,許多數(shù)據(jù)中心遭到了強烈反對,甚至由于所需的電力和水量,新建筑也面臨許可障礙。為這些大型計算平臺提供動力和冷卻已成為可持續(xù)發(fā)展的熱點,而電源使用效率 (PUE) 和碳排放等指標是首要考慮因素。
許多HPC公司和云服務(wù)公司提出創(chuàng)新理念來應(yīng)對這些挑戰(zhàn)。通過可持續(xù)能源(水力、太陽能、風(fēng)能)為數(shù)據(jù)中心供電的根本轉(zhuǎn)變正變得越來越普遍。也衍生了許多新方法,例如沉浸式或液體冷卻技術(shù)(包括水下數(shù)據(jù)中心);將數(shù)據(jù)中心消耗的能源和水重新分配和回收用于其他用途(例如,為建筑物供暖);供應(yīng)鏈生態(tài)系統(tǒng)使用更環(huán)保的組件、材料和制造方法都具有巨大的潛力。HPCaaS 模型本質(zhì)上也是一種資源效率更高的方法。
也可以在芯片級別提高能耗和散熱效率。例如,高性能計算IC設(shè)計可以通過使用先進的低功耗設(shè)計方法和功耗優(yōu)化的IP核來更好地優(yōu)化功耗,從而降低芯片和整個系統(tǒng)的整體能耗。
Chiplet趨勢提供了另一種降低功耗的重要潛在方法,更不用說通過提高產(chǎn)量來減少制造中的物理浪費。對功耗更敏感的數(shù)據(jù)傳輸方法,如高帶寬存儲器(HBM),也可以使芯片及其供電的系統(tǒng)更加節(jié)能。這些都得到了標準和開源工作(如CXL,UCIe和OCP)的幫助。
總之,HPC行業(yè)正在不斷發(fā)展和擴大,每天都為我們的生活帶來新的改善。
審核編輯:湯梓紅
-
人工智能
+關(guān)注
關(guān)注
1806文章
48987瀏覽量
249065 -
HPC
+關(guān)注
關(guān)注
0文章
333瀏覽量
24304 -
邊緣計算
+關(guān)注
關(guān)注
22文章
3320瀏覽量
50861
原文標題:2023 年值得關(guān)注的五大 HPC 趨勢
文章出處:【微信號:ICViews,微信公眾號:半導(dǎo)體產(chǎn)業(yè)縱橫】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
格靈深瞳入選量子位2025年AIGC雙榜單
2025年機器人行業(yè)的五大趨勢
北京市最值得去的十家半導(dǎo)體芯片公司
2025年功率半導(dǎo)體的五大發(fā)展趨勢

戴爾副總裁揭示:智能邊緣發(fā)展的五大定義趨勢
2025年功率半導(dǎo)體五大關(guān)鍵趨勢
德州儀器分析服務(wù)器電源設(shè)計中的五大趨勢

2025年值得推薦的會議室音響系統(tǒng)包含哪些設(shè)備
IBM發(fā)布2025年AI五大趨勢
富士通預(yù)測2025年AI領(lǐng)域的發(fā)展趨勢
線上逛展 | 沉浸探索第三屆OpenHarmony技術(shù)大會五大展區(qū)
《RISC-V產(chǎn)業(yè)年鑒2023》發(fā)布,洞察產(chǎn)業(yè)發(fā)展現(xiàn)狀與趨勢

評論