在邊緣計算、Chiplet、人工智能和機器學習、CaaS(容器即服務)以及可持續性發展的推動下,高性能計算變得越來越重要。
高性能計算(HPC)的概念在過去幾年中不斷發展,無論是在其嚴格的定義方面,還是如何使用它。如今,HPC 不再局限于大型數據中心、研究實驗室和超級計算機,而是在各個行業中用于產品設計、財務建模、天氣預報等任務。它已經滲透到更接近我們日常生活的應用程序中,它能夠將更強大的計算機功能帶入我們依賴和享受的家庭、辦公室和汽車體驗中。
HPC 增長和擴展的根本原因可以歸結為一個詞:數據。因為其中有更多數據需要比以往更快地處理、分析和移動。高性能計算解決了更多數據產生、服務和消費無限循環——無論是智能家居的多服務流媒體習慣、日益互聯的汽車,還是我們完成工作、監控我們的健康或管理我們的財務所需的信息量。
隨著對 HPC 需求的增長,對更快、更強大、更高效的半導體的需求同步攀升。事實上,盡管芯片業務的整體起伏不定,但HPC行業仍實現了持續和可持續的增長。那么,2023 年高性能計算的未來是什么?
邊緣(分布式)計算的增長
毫無疑問,邊緣計算是改變計算格局的關鍵發展趨勢,但它似乎與傳統HPC相差較多。高性能計算往往與大型集中式計算和存儲資源相關聯,而這些資源實際上是基于云的遠程計算的支柱。相比之下,邊緣計算以處理網絡邊緣或附近的數據為中心,而不是將其一直發送回中心位置。通過這種方式,它可以提供更低的延遲,并且在許多情況下可以提供更安全的操作特性。
邊緣計算與傳統計算正在融合。由于數據的爆炸式增長,在邊緣生成的數據量在數量和復雜性方面呈指數級增長,包括由智能化需求推動的各種物聯網 (IoT) 設備。邊緣計算主要用于延遲和內容,因為往返云/集中式數據中心的往返將無法滿足所需的響應時間。在某些情況下,文件太大,無法發送到云進行處理甚至存儲。這可能影響城市交通管理和相關的自動駕駛系統、精準醫療、欺詐檢測、商業智能、智能城市開發等。
邊緣計算將對 HPC 系統供應商、云服務提供商、網絡和存儲供應商產生重大影響,因為組織希望將遠程 HPC 功能與本地生成和處理的數據策略相結合。作為其中的一部分,還希望看到HPC的物理足跡從集中式交付模型擴展到更加分布式的方法,其中包括靠近大量數據生成邊緣站點的位置。
從芯片設計來看,邊緣計算雖然仍然需要最佳的功耗、性能和面積(PPA),但仍然具有另一個關鍵優先事項:減少這些設備處理和數據傳輸的延遲。設計策略必須優先考慮這些IC的數據傳輸速度和效率,例如下面討論的Chiplet架構。當然,芯片設計解決方案必須考慮PPA權衡方案的所有方面,并提供高級功能來設計和分析針對任何給定應用要求的優化IC。這包括強大的仿真和驗證工具、功耗和熱分析功能、設計布局的智能實現,以及一系列用于關鍵功能和接口的認證 IP 模塊。展望未來,我們將看到從數據中心到電池供電的物聯網設備對能夠降低功耗的設計解決方案的需求不斷增加。
Chiplet成熟
HPC的最新趨勢之一是使用多芯片系統。多芯片系統在高性能計算領域獲得了青睞,作為保持摩爾定律(由于器件物理和制造傳統單片硅架構的經濟挑戰而放緩)走上正軌的一種方式。簡而言之,傳統的單片片上系統(SoC)變得過于龐大和昂貴,無法用于高級設計,并且良率風險隨著設計尺寸的增加而增加。多芯片方法作為擴展摩爾定律的PPA優勢的可行方法很有吸引力,無需增加芯片面積或功耗即可提供更多的處理能力。它們還支持異構混合搭配方法,以最大限度地利用目標應用優化的工藝技術。分解 SoC 組件,單獨制造它們,然后將這些不同的功能整合到單個封裝中,從而減少浪費,同時提供一種快速創建具有優化系統功耗和性能的新產品變體的方法。
雖然多芯片系統完全有能力成為 HPC 的基本推動因素,但設計方法必須不斷發展以應對新的挑戰。例如,支持高帶寬、低延遲、高能效和無差錯性能的芯片到芯片接口對于快速、可靠的數據傳輸至關重要。需要增強的工具、方法和 IP 來處理這種多芯片方法引起的異構集成、互連和封裝問題。先進封裝和硅光子學等領域的其他專業知識和技術對于推動創新和設計效率達到新的水平非常重要。
人工智能和機器學習的擴展范圍
另一個貫穿 HPC 各個方面的重要趨勢是人工智能 (AI) 和機器學習的興起。這是 HPC 享有共生關系的領域。
一方面,高性能計算機需要為人工智能工作負載提供動力,這在當今自動化數據密集型世界中無處不在。對于HPC供應商來說,這是一個快速增長的領域,他們幾乎在有計算需求的地方看到了新的機會。但是,為了支持AI工作負載,計算平臺需要不斷改進底層硬件的性能,這給芯片設計人員帶來了不斷創新的壓力。在這里,人工智能也與支持人工智能的設計工具一起發揮作用,現在用于通過優化復雜或過于詳細的任務來處理尖端芯片設計的復雜性和規模,這些任務可以最好地由訓練有素的人工智能算法處理。這不僅提高了整體工程效率,而且使設計師能夠專注于更多以創新為導向的工作。
另一方面,高性能計算依賴于人工智能本身來高效安全地運行數據中心。無論是監控存儲、服務器和網絡設備的運行狀況和安全性,確保正確配置,預測設備故障,以及篩選惡意軟件數據,AI 都能為 HPC 用戶提供更高水平的洞察力和預測性維護。人工智能還可用于通過優化加熱和冷卻系統來減少電力消耗并提高效率,這是數據中心運營商最關心的關鍵可持續性問題。
高性能計算系統案例
隨著業務各個方面所需的計算能力的大幅提高,許多公司正在尋求“即服務”模型的價值,以滿足其周期性計算需求。輸入 HPC 即服務 (HPCaaS),除了峰值工作負載效率之外,此類模型還為沒有內部知識、資源或基礎設施的公司提供服務和支持,無法通過云利用 HPC。HPCaaS 使 HPC 容量易于部署、擴展,并且從成本角度來看更具可預測性。
在IC設計領域,人們對這種模型非常感興趣,該模型可以訪問執行數據密集型芯片設計任務所需的計算資源。由多核架構組成的復雜 HPC IC 設計就是一個很好的例子。它們需要增加計算、存儲和處理以進行設計和開發。通常需要并行處理大量數據,以實現這些類型設計的設計和驗證的收斂。這種托管模型正在被大型半導體公司和初創公司使用,這些公司和初創公司正在為HPC開發高性能芯片,這是一種有趣的共生關系,HPC的推動者也取決于其功能。
與其他 HPCaaS 企業用途一樣,基于云的 EDA 在 IC 開發過程中提供了可擴展性、靈活性、生產力和安全性。公司可以根據特定的使用需求、高峰設計時間和分布式工作結構調整 HPC 訪問,所有這些都不需要專門的資源管理專業知識。所有這些好處都與性能吞吐量優勢相提并論,這是對 EDA 工具的關鍵需求。
可持續發展成為舞臺中心
盡管我們以最快的速度改進了 HPC 功能,并在生活的許多方面擴展了收益,但正在為這些耗電系統對環境的影響付出代價。一些專家預測,到2030年,僅數據中心就將消耗全球3%至7%的電力。在地方層面,許多數據中心遭到了強烈反對,甚至由于所需的電力和水量,新建筑也面臨許可障礙。為這些大型計算平臺提供動力和冷卻已成為可持續發展的熱點,而電源使用效率 (PUE) 和碳排放等指標是首要考慮因素。
許多HPC公司和云服務公司提出創新理念來應對這些挑戰。通過可持續能源(水力、太陽能、風能)為數據中心供電的根本轉變正變得越來越普遍。也衍生了許多新方法,例如沉浸式或液體冷卻技術(包括水下數據中心);將數據中心消耗的能源和水重新分配和回收用于其他用途(例如,為建筑物供暖);供應鏈生態系統使用更環保的組件、材料和制造方法都具有巨大的潛力。HPCaaS 模型本質上也是一種資源效率更高的方法。
也可以在芯片級別提高能耗和散熱效率。例如,高性能計算IC設計可以通過使用先進的低功耗設計方法和功耗優化的IP核來更好地優化功耗,從而降低芯片和整個系統的整體能耗。
Chiplet趨勢提供了另一種降低功耗的重要潛在方法,更不用說通過提高產量來減少制造中的物理浪費。對功耗更敏感的數據傳輸方法,如高帶寬存儲器(HBM),也可以使芯片及其供電的系統更加節能。這些都得到了標準和開源工作(如CXL,UCIe和OCP)的幫助。
總之,HPC行業正在不斷發展和擴大,每天都為我們的生活帶來新的改善。
審核編輯:湯梓紅
-
人工智能
+關注
關注
1791文章
47208瀏覽量
238303 -
HPC
+關注
關注
0文章
315瀏覽量
23756 -
邊緣計算
+關注
關注
22文章
3085瀏覽量
48906
原文標題:2023 年值得關注的五大 HPC 趨勢
文章出處:【微信號:ICViews,微信公眾號:半導體產業縱橫】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論