AI 服務器是專門為運行人工智能算法和處理大規模數據而設計的高性能計算機,它們通常 具備高處理能力、大內存和高速存儲器、多核心處理器、高速網絡接口等特點,能夠應對復 雜的計算任務和大數據量的處理任務。 AI 服務器中 PCB 價值量的提升主要體現在以下幾個模塊:GPU 加速卡(OAM),主要由 GPU 芯片、內存芯片、電源模塊、散熱器等部件組成,通過 PCB 板 來連接和傳輸信號。GPU 加速卡可以分為兩種類型:SXM 版本和 PCIE 版本。SXM 版本是指使 用 NVIDIA 公司開發的 SXM 接口連接 GPU 芯片和主板的加速卡;PCIE 版本是指使用標準的 PCIE 接口連接 GPU 芯片和主板的加速卡。SXM 版本相比 PCIE 版本具有更高的帶寬和更低的 延遲,但也需要更高級別的 PCB 板和散熱系統。
先進的 GPU 加速卡需要使用 5 階 20 層或以上的 HDI 板,HDI 板是高密度互連板的簡稱,它是 一種通過激光鉆孔或微細加工技術,在普通 PCB 板上形成微小的孔徑或線寬,從而實現更高 層次、更密集的布線和連接的 PCB 板。HDI 板可以提高信號完整性、降低電磁干擾、縮小尺 寸和重量、增強可靠性等優點。HDI 板可以分為不同的階數和層數,階數表示每個層面上有 多少次激光鉆孔或微細加工,層數表示有多少個層面疊加在一起。一般來說,階數越高,層 數越多,HDI 板的密度和復雜度就越高。
GPU 芯片和內存芯片都有很多引腳或焊盤,需要通過 HDI 板來實現高效率、低延遲、低功耗、低噪聲的信號傳輸。 GPU 加速卡需要使用高層次、高密度、高可靠性的 HDI 板來連接各個部件,主要有以下幾個 原因:GPU 芯片和內存芯片都有很多引腳或焊盤,需要通過 HDI 板來實現高效率、低延遲、低 功耗、低噪聲的信號傳輸。GPU 加速卡的功耗較高,會產生大量的熱量,如果不能及時散發,會影響其穩定性和壽 命。
因此,需要使用具有良好導熱性能的 HDI 板材料。GPU 加速卡的尺寸較小,需要使用 HDI 板來減少 PCB 板的面積和厚度,提高空間利用率 和散熱效果。GPU 加速卡的性能較高,需要使用 HDI 板來支持更高的頻率和帶寬,提高數據傳輸速度 和質量。
5 階 20 層以上的 HDI 板是目前 PCB 行業中高端且昂貴的產品之一,其制造工藝要求非常高, 需要使用先進的設備、材料和工藝。目前,全球能夠生產這種 HDI 板的廠商很少,主要集中 在日本、韓國、中國臺灣等地。 GPU 加速卡對 CCL 的具體要求主要有以下幾點:
高頻高速性能:由于 AI 服務器需要處理大量的數據和信號,因此 GPU 加速卡需要使用 具有高頻高速性能的 CCL,即能夠在高頻率下保持低損耗、低時延、低串擾、低噪聲等 特性的 CCL。這需要 CCL 具有較低的介電常數(Dk)、介電損耗(Df)、表面粗糙度(Rz) 等參數。
導熱性能:由于 GPU 加速卡的功耗較高,會產生大量的熱量,如果不能及時散發,會影 響其穩定性和壽命。因此,GPU 加速卡需要使用具有良好導熱性能的 CCL,即能夠有效 地將熱量從芯片傳導到散熱器或外部環境的 CCL。這需要 CCL 具有較高的導熱系數(K) 和較低的熱膨脹系數(CTE)等參數。
可靠性:由于 GPU 加速卡需要在復雜的環境中長期穩定運行,因此 GPU 加速卡需要使用 具有高可靠性的 CCL,即能夠抵抗各種應力和環境因素的影響,保持其結構和功能不變 的 CCL。這需要 CCL 具有較高的玻璃化轉變溫度(Tg)、較低的水分吸收率(MOT)、較強 的機械強度和耐化學腐蝕性等參數。
GPU 模組板(UBB),即 Unit Baseboard,是一種用于搭載整個 GPU 平臺的 PCB 板。GPU 模組 板的主要功能是連接多個 GPU 加速卡并與 CPU 主板通信。GPU 加速卡,即 Open Accelerator Module,是一種基于開放標準設計的 GPU 模塊,可以插入到 GPU 模組板上。
GPU 之間的高速互聯可以通過 NVLink + NVSwitch 實現。NVSwitch 是英偉達推出的一種高性 能交換芯片,用于實現多個 GPU 加速卡之間的互聯和通信,NVLink 2.0 協議最大能夠提供每 秒 900GB 的雙向帶寬。第三代 NVSwitch 有 64 個第四代 NVLink 端口,每個端口可以連接一 個 GPU 加速卡或一個 CPU 主板,從而實現多達 64 個 GPU 加速卡的全互聯架構。NVSwitch 基 于 NVLink 的高級通信能力構建,可為計算密集型工作負載提供更高帶寬和更低延遲。
基于 第三代 NVSwitch,通過在服務器外部添加第二層 NVSwitch,NVLink 網絡可以連接多達 32 個 服務器、256 個 GPU,并提供 57.6TB/s 的多對多帶寬,實現 GPU 在服務器節點間通信擴展, 形成數據中心大小的 GPU。為了實現高速、高效、高可靠的數據傳輸和圖形處理,GPU 模組板需要使用高多層通孔板(THP 板)作為載體。
THP 板是指通過機械鉆孔或激光鉆孔,在普通 PCB 板上形成大量的通孔,并 在通孔內壁鍍上一層導電銅箔,從而實現不同層面之間的電氣連接。THP 板可以分為不同的 層數,層數表示有多少個層面疊加在一起。一般來說,層數越多,THP 板的密度和復雜度就 越高。 GPU 模組板需要使用高多層 THP 板來實現高速數據傳輸和高頻信號處理的原因有:GPU 模組板需要處理大量的數據和信號,因此需要使用具有高頻高速性能的 THP 板,即 能夠在高頻率下保持低損耗、低時延、低串擾、低噪聲等特性的 THP 板。這需要 THP 板 具有較低的介電常數(Dk)、介電損耗(Df)、表面粗糙度(Rz)等參數。GPU 模組板需要連接多個 NVLink 芯片和 GPU 加速卡,因此需要使用具有高層次的 THP 板,即能夠實現更多的信號通道和更好的電氣性能的 THP 板。
這需要 THP 板具有較高的 線寬線距、孔徑、阻抗控制等參數。GPU 模組板的功耗較高,會產生大量的熱量,如果不能及時散發,會影響其穩定性和壽 命。因此,GPU 模組板需要使用具有良好導熱性能的 THP 板,即能夠有效地將熱量從芯 片傳導到散熱器或外部環境的 THP 板。這需要 THP 板具有較高的導熱系數(K)和較低 的熱膨脹系數(CTE)等參數。
GPU 模組板對覆銅板有以下具體要求:
層數:由于 GPU 模組板需要連接多個 GPU 加速卡,并且需要實現多層次的電源分配網絡 (PDN),因此需要使用較高層數的覆銅板。目前,GPU 模組板使用的覆銅板一般在 16 層 以上;
電性能:由于 GPU 模組板需要支持高速數據傳輸和高頻信號處理,因此需要使用具有較 低介電常數(Dk)和介質損耗因子(Df)的覆銅板,以減少信號的衰減和失真,提高信 號的完整性和可靠性,目前 GPU 模組板使用的覆銅板一般采用 PPO 等高性能樹脂材料;
熱性能:由于 GPU 模組板需要承受較高的功耗和發熱量,因此需要使用具有較高熱導率 和熱穩定性的覆銅板,以有效地將熱量從元器件傳導到散熱模組,防止過熱造成性能下 降或損壞。
目前,GPU 模組板使用的覆銅板一般采用金屬基板或者添加導熱填料的復合 基板;加工性能:由于 GPU 模組板需要實現較多的通孔連接不同層次的電路線路,并且需要實 現較大的面積和厚度,因此需要使用具有較好加工性能的覆銅板,以滿足 THB 的要求, 提高 PCB 的質量和良率。目前,GPU 模組板使用的覆銅板一般采用改性 PPO(MPPO)等 可交聯的熱固性材料,可以提高流動性和加工性。
CPU 主板,是 AI 服務器中連接 CPU、內存、存儲等核心部件的部件,它可以實現 CPU 與其他 部件之間的高速數據傳輸,并通過 PCIe 5.0 實現與 GPU 主板的互聯。CPU 主板一般采用 ATX 或 EATX 等標準規格,其尺寸為 305mm x 244mm 或 305mm x 330mm,其內部包含一個或多個 CPU 插槽、內存插槽、存儲插槽、電源管理芯片等元器件。CPU 主板通過 PCIe 插槽連接到 GPU 主板上,并通過 PCIe 實現高速數據傳輸。
CPU 主板使用的 PCB 一般為高多層通孔板(Through Hole Board, THB),其特點是具有較多 的通孔連接不同層次的電路線路,并且可以實現較大的面積和厚度。THB 可以實現更強的結 構支撐和散熱能力,并且可以承載更多更復雜的元器件。
CPU 主板對覆銅板有以下具體要求:
介電常數和介質損耗:這兩個參數影響信號的傳輸速度和能量損失,對于高頻、高速的 CPU 主板來說,需要選擇低介電常數和低介質損耗的 CCL,以保證信號的完整性和質量。
熱膨脹系數:這個參數影響 CCL 在溫度變化時的尺寸穩定性,對于高溫、高功率的 CPU 主板來說,需要選擇熱膨脹系數與銅箔相近的 CCL,以避免因為熱應力導致的層間分離 或過孔開裂等缺陷。
熱導率:這個參數影響 CCL 在散熱方面的性能,對于高溫、高功率的 CPU 主板來說,需 要選擇熱導率較高的 CCL,以有效地將熱量從 CPU 和其他元件傳導到散熱器或外部環境。
阻燃等級:這個參數影響 CCL 在遇到火災時的安全性能,對于所有的電子產品來說,都需要選擇阻燃等級較高的 CCL,以防止因為火災引起的人員傷亡或財產損失。一般來說, 阻燃等級應達到 UL94 V-0 或以上。
據產業調研,預估 2024 年 AI 加速卡需求為 400 萬顆,加速卡 PCB 用量平均單價 100 美元/ 顆,如果折算成英偉達 DGX A100 服務器對應為 50 萬臺,對應 UBB 板的 PCB 用量為 1000 美 元/臺,對應 CPU 主板的 PCB 用量為 200 美元/臺,這三部分帶來是市場增量合計 10 億美元。
此外,隨著PCIe 標準升級下信息交互速度不斷提升,對 PCB 的設計、走線、板材選擇等要求提高。
PCIE5.0(第五代 PCI Express 總線標準),是一種用于連接各種外設設備的高速串行接口, 于 2019 年 5 月正式發布。PCIE5.0 相比于上一代 PCIE4.0,帶寬提升了一倍,能夠支持更高 性能的 CPU、GPU、存儲等設備,滿足 AI 服務器等高算力需求。通過改變電氣設計改善信號 完整性和機械性能,PCIE5.0 新標準減少了延遲,降低了長距離傳輸的信號衰減。與 PCIE4.0 相比,PCIE5.0 信號速率達到 32GT/s,x16 帶寬(雙向)提升到了 128GB/s,能夠更好地滿足 吞吐量要求高的高性能設備,如數據中心、邊緣計算、機器學習、AI、5G 網絡等場景日益增 長的需求。除了保證高速傳輸的能力,PCIE5.0 還進一步加強了信號完整性,不僅適合連接 顯卡、SSD 等配件,也適用于平臺總線的使用。
目前 PCB 主流板材為 8-16 層,對應 PCIe 3.0 一般為 8-12 層,4.0 為 12-16 層,而 5.0 平臺則在 16 層以上。從材料的選擇上來看, PCIe 升級后服務器對 CCL 的材料要求將達到高頻/超低 損耗/極低損耗級別。 據產業調研,目前支持 PCIe3.0 標準的 Purley 平臺 PCB 價值量約 2200- 2400 元,支持 PCIe4.0 的 Whitley 平臺 PCB 價值量提升 30%-40%,支持 PCIe5.0 的 Eagle 平 臺的 PCB 價值量比 Purley 高一倍。根據我們測算,到 2025 年,PCIe 5.0 的升級有望為服務 器平臺 PCB 帶來百億的價值增量。
編輯:黃飛
評論
查看更多