高性能計算的開端
多年來,高性能計算 (HPC) 具有多種含義。HPC 的主要目標是提供運行數據中心所需的計算能力,數據中心是一個致力于存儲、處理和分發數據的實用設施。從歷史上看,正在處理的數據是給定組織的業務運營輸出。交易,客戶資料,銷售細節,諸如此類。目標通常是從大量事務信息中創建商業智能。
有時,數據代表研究。在這種情況下,商業智能是追求某種物理效應的知識——我們如何用測量數據推斷更多,以提高我們的知識和利潤?藥物發現、油田分析和天氣預報都是這種數據處理的例子。
多年來,數據中心使用硬件補充來執行此類操作,這些硬件主要包括陣列配置中的存儲、計算和通信。更多的數據意味著更多的存儲、計算和通信副本。
這種類型的數據中心有兩個關鍵屬性。首先,正在處理的數據是由真實世界的事件生成的。用于研究的銷售、交易和物理觀察數據都是以與人類交互一致的速度生成的數據示例。其次,數據處理以創建信息是使用程序軟件系統完成的,由人類編寫和調試。
指數增長的時代
在過去的大約 10 年里,上述范式在要處理的數據量和處理方式方面都發生了根本性的變化。讓我們看看這兩種現象。
數據不再由人類事件生成。由于廣泛的傳感器部署,再加上高度連接的環境,所有類型的設備都在以指數級的速度生成數據。您的智能手表會捕獲有關您的鍛煉方案和健康的詳細信息。根據一項研究,自動駕駛汽車每小時運行可以產生5TB的數據。如果您考慮未來幾年將有多少此類車輛投入使用,您可以清楚地看到數據雪崩。
Statista對這些趨勢的綜合進行了透視。下圖是 2010 年至 2025 年全球創建、捕獲、復制和使用的數據量的預計數據量(以澤字節為單位)。一個澤字節大約是一千艾字節或十億太字節。請注意,在2010年,地球包含兩個澤字節的數據,而到181年的項目量為2025澤字節。
資料來源:統計局
提取情報的方式也發生了變化。各種形式的人工智能 (AI) 用于從所有這些數據中提取關鍵的、可操作的見解。推理方法可以識別語音和視覺模式。強化學習技術可以從大量可能性中識別出最佳結果。
這種處理看起來也不像傳統軟件。它不是人類編寫的代碼。相反,它是大量的處理事件,通過檢查大量信息和結果來操作和學習。
和指數級挑戰
隨著過去十年中信息生成、信息處理和存儲的這種根本性轉變,數據中心架構在同一時期發生了巨大變化也就不足為奇了。復制存儲、計算和通信元素以滿足需求的策略根本行不通。
數據量的爆炸式增長需要依賴分布式網絡的新存儲方法。無論計算速度有多快,都無法再使用中央處理器完成。相反,需要針對特定工作負載優化的自定義處理元素。他們中的許多人,在海量分布式數據集上以同步的方式執行不同的任務。溝通也大不相同。從性能(延遲)的角度來看,數據中心服務器機架中的離散網絡接口卡 (NIC) 和架頂式交換機等概念在數據中心內移動數據不再有效。
數據中心復興
現在有些組織從大量數據中推斷情報是核心業務的一部分。這些公司引領了數據中心的復興。這些公司被稱為 超大規模企業, 重新定義了數據中心的架構及其在社會中的地位。谷歌、亞馬遜、Facebook、微軟、阿里巴巴、百度和騰訊都是超大規模企業。
他們各自以自己的方式推進了數據中心設計和信息處理的狀態。谷歌構建了其張量處理單元(TPU),以提供運行AI算法的正確架構。亞馬遜出于同樣的原因建立了AWS Trainium。事實上,幾乎所有的超大規模企業都在構建定制芯片來為其數據中心提供動力。
數據中心的配置方式也在發生變化。內存、存儲、處理能力和網絡帶寬等關鍵元素現在已池化。然后,可以根據特定工作負載的需求組合和部署這些資源,而不是在服務器中配置這些資源的正確組合。隨著工作負載的變化,數據中心的架構也會發生變化。這種方法被稱為可組合數據中心。
數據中心的商業模式也發生了變化。雖然在現場,私人設施仍然相當普遍,但建造和運營下一代設施的極端成本可能令人望而卻步。結果,那些能夠建造它們的人這樣做,他們也向那些不能建造它們的人出售能力。這就是云計算的誕生。這個過程類似于芯片制造的情況。許多公司擁有并經營晶圓廠,直到成本變得令人望而卻步,技術變得非常復雜。在這一點上,出現了一些關鍵參與者,他們為任何需要的人提供晶圓廠的能力。
以及更多挑戰
正如他們所說,魔鬼在細節中。數據中心的復興絕對是正確的。最終結果在范圍和影響上都非常壯觀。但是,實現所有這些功能會帶來一系列挑戰。
眾所周知,摩爾定律正在放緩。進入下一個工藝節點無法獲得成功所需的性能、能源效率和成本降低。摩爾定律的擴展優勢仍然很重要,但其他策略也開始發揮作用。
摩爾定律的規模復雜性現在輔以一系列利用系統復雜性的策略。用于執行特定 AI 算法的專用定制設備就是其中之一。TPU和Trainium就是這樣的例子。創建由芯片、密集存儲器或小芯片組成的多芯片設計到單個系統中的方法是另一個艱巨的挑戰。添加大量內存作為 3D 堆棧并同步大型且高度復雜的軟件堆棧以在這些新架構上運行也是如此。
公共云計算也高度重視安全性。在公共云數據中心中創建的信息和見解非常有價值。需要硬件和軟件系統來保護該信息的安全。
這個創新的新時代將摩爾定律的規模復雜性與利用系統復雜性的新方法相結合。我們稱之為SysMoore時代,它正在改變我們所知道的生活。
迎接系統摩爾時代的挑戰
馴服大型芯片和芯片系統的設計復雜性是成功的關鍵項目。將所有這些技術集成到一個統一的系統中的方法則是另一種。還需要強大的驗證、強大的安全性和可靠性,以及低能耗和值得信賴的預驗證構建塊來源。
好消息是,Synopsys 全面專注于高性能計算和數據中心開發。我們為整個過程提供端到端的解決方案,具有強大的設計優化和生產力。我們的預驗證 IP 產品組合可滿足所有要求。我們甚至可以提供設計服務,幫助您建立下一個企業,在設計、實施和驗證EDA工具和方法方面擁有熟練的資源,以及在先進技術節點中集成復雜的IP。
我們還可以向您展示如何在現場部署設計后監控和優化設計性能,并集成最新的光子學功能。
數據中心確實已經走了很長一段路。它們不再只是一個實用程序。最先進的設施產生的見解改善了我們的健康和安全,使我們的社會團結在一起,甚至改善了地球的環境。他們現在確實是宇宙的中心。
審核編輯 黃宇
-
芯片
+關注
關注
455文章
50714瀏覽量
423137 -
數據中心
+關注
關注
16文章
4761瀏覽量
72033 -
高性能計算
+關注
關注
0文章
82瀏覽量
13385
發布評論請先 登錄
相關推薦
評論