色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何使用PCIe交換網結構在多主機系統中優化資源部署

李鴻洋 ? 來源:小嘛小二郎呀 ? 作者:小嘛小二郎呀 ? 2022-08-01 09:19 ? 次閱讀

越來越多的數據中心和其他高性能計算環境開始使用GPU,因為GPU能夠快速處理深度學習機器學習應用中生成的大量數據。不過,就像許多可提高應用性能的新型數據中心創新一樣,這項創新也暴露出新的系統瓶頸。在這些應用中,用于提高系統性能的新興架構涉及通過一個PCIe?結構在多個主機之間共享系統資源。

PCIe標準(特別是其基于樹的傳統層級)會限制資源共享的實現方式(和實現程度)。不過,可以實現一種低延時的高速結構方法,這種方法允許在多個主機之間共享大量GPU和NVMe SSD,同時仍支持標準系統驅動程序。

PCIe結構方法采用動態分區和多主機單根I/O虛擬化(SR-IOV)共享。各PCIe結構之間可直接路由點對點傳輸。這樣便可為點對點傳輸提供最佳路由,減少根端口擁塞,并且更有效地平衡CPU資源的負載。

傳統上,GPU傳輸必須訪問CPU的系統存儲器,這會導致端點之間發生存儲器共享爭用。 當GPU使用其共享的存儲器映射資源而不是CPU存儲器時,它可以在本地提取數據,無需先通過CPU傳遞數據。這消除了跳線和鏈路以及由此產生的延時,從而使GPU能夠更高效地處理數據。

PCIe的固有限制

PCIe主層級是一個樹形結構,其中的每個域都有一個根聯合體,從該點可擴展到“葉子”,這些“葉子”通過交換網和橋接器到達端點。鏈路的嚴格層級和方向性給多主機、多交換網系統帶來了成本高昂的設計要求。

圖1——多主機拓撲

以圖1所示的系統為例。要符合PCIe的層級,主機1必須在交換網1中有一個專用的下行端口,該端口連接到交換網2中的專用上行端口。它還需要在交換網2中有一個專用的下行端口,該端口連接到交換網3中的專用上行端口,依此類推。主機2和主機3也有類似的要求,如圖2所示。

圖2——每個主機的層級要求

即使是基于PCIe樹形結構的最基本系統,也需要各交換網之間有三個鏈路專用于每個主機的PCIe拓撲。而且,由于主機之間無法共享這些鏈路,因此系統會很快變得極為低效。

此外,符合PCIe的典型層級只有一個根端口,而且盡管“多根I/O虛擬化和共享”規范中支持多個根,但它會使設計更復雜,并且當前不受主流CPU支持。結果會造成未使用的PCIe設備(即端點)滯留在其分配到的主機中。不難想象,這在采用多個GPU、存儲設備及其控制器以及交換網的大型系統中會變得多么低效。

例如,如果第一個主機(主機1)已經消耗了所有計算資源,而主機2和3未充分利用資源,則顯然希望主機1訪問這些資源。但主機1無法這樣做,因為這些資源在它的層級域之外,因此會發生滯留。非透明橋接(NTB)是這種問題的一個潛在解決方案,但由于每種類型的共享PCIe設備都需要非標準驅動程序和軟件,因此這同樣會使系統變得復雜。更好的方法是使用PCIe結構,這種結構允許標準PCIe拓撲容納多個可訪問每個端點的主機。

實施方法

系統使用一個PCIe結構交換網(本例中為Microchip Switchtec? PAX系列的成員)在兩個獨立但可透明互操作的域中實現:即包含所有端點和結構鏈路的結構域以及每個主機專用的主機域(圖3)。主機通過在嵌入式CPU上運行的PAX交換網固件保留在單獨的虛擬域中,因此,交換網將始終顯示為具有直連端點的標準單層PCIe設備,而與這些端點出現在結構中的位置無關。

圖3——每個結構的獨立域

來自主機域的事務會在結構域中轉換為ID和地址,反之,結構域中通信的非分層路由也是如此。這樣,系統中的所有主機便可共享連接交換網和端點的結構鏈路。交換網固件會攔截來自主機的所有配置平面通信(包括PCIe枚舉過程),并使用數量可配置的下行端口虛擬化一個符合PCIe規范的簡單交換網。

當所有控制平面通信都路由到交換網固件進行處理時,數據平面通信直接路由到端點。其他主機域中未使用的GPU不再滯留,因為它們可以根據每個主機的需求動態分配。結構內支持點對點通信,這使其能夠適應機器學習應用。當以符合PCIe規范的方式向每個主機提供功能時,可以使用標準驅動程序。

操作方法

為了解這種方法的工作原理,我們以圖4中的系統為例,該系統由兩個主機(主機1采用Windows?系統,主機2采用Linux?系統)、四個PAX PCIe結構交換網、四個Nvidia M40 GPGPU和一個支持SR-IOV的Samsung NVMe SSD組成。在本實驗中,主機運行代表實際機器學習工作負載的通信,包括Nvidia的CUDA點對點通信基準測試實用程序和訓練cifar10圖像分類的TensorFlow模型。嵌入式交換網固件處理交換網的低級配置和管理,系統由Microchip的ChipLink調試和診斷實用程序管理。

圖4:雙主機PCIe結構引擎

四個GPU最初分配給主機1,PAX結構管理器顯示在結構中發現的所有設備,其中GPU綁定到Windows主機。但是,主機上的結構不再復雜,所有GPU就像直接連接到虛擬交換網一樣。隨后,結構管理器將綁定所有設備,Windows設備管理器將顯示GPU。主機將交換網視為下行端口數量可配置的簡單物理PCIe交換網。

一旦CUDA發現了四個GPU,點對點帶寬測試就會顯示單向傳輸速率為12.8 GBps,雙向傳輸速率為24.9 GBps。這些傳輸直接跨過PCIe結構,而無需通過主機。如果運行用于訓練Cifar10圖像分類算法的TensorFlow模型并使工作負載分布在全部四個GPU上,則可以將兩個GPU釋放回結構池中,將它們與主機解除綁定。這樣可以釋放其余兩個GPU來執行其他工作負載。與Windows主機一樣,Linux主機也將交換網視為簡單的PCIe交換網,無需自定義驅動程序,而CUDA也可以發現GPU,并在Linux主機上運行P2P傳輸。性能類似于使用Windows主機實現的性能,如表1所示。

表1:GPU點對點傳輸帶寬

下一步是將SR-IOV虛擬功能連接到Windows主機,PAX將此類功能以標準物理NVM設備的形式提供,以便主機可以使用標準NVMe驅動程序。此后,虛擬功能將與Linux主機結合,并且新的NVMe設備將出現在模塊設備列表中。本實驗的結果是,兩個主機現在都可以獨立使用其虛擬功能。

務必注意的是,虛擬PCIe交換網和所有動態分配操作都以完全符合PCIe規范的方式呈現給主機,以便主機能夠使用標準驅動程序。嵌入式交換網固件提供了一個簡單的管理接口,這樣便可通過成本低廉的外部處理器來配置和管理PCIe結構。設備點對點事務默認情況下處于使能狀態,不需要外部結構管理器進行額外配置或管理。

總結

PCIe交換網結構是一種能夠充分利用CPU巨大性能的絕佳方法,但PCIe標準本身存在一些障礙。不過,可以通過使用動態分區和多主機單根I/O虛擬化共享技術來解決這些難題,以便可以將GPU和NVMe資源實時動態分配給多主機系統中的任何主機,從而滿足機器學習工作負載不斷變化的需求。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4743

    瀏覽量

    128992
  • PCIe
    +關注

    關注

    15

    文章

    1241

    瀏覽量

    82723
  • 管理器
    +關注

    關注

    0

    文章

    246

    瀏覽量

    18530
收藏 人收藏

    評論

    相關推薦

    Littrow結構光柵系統的配置與優化

    和光柵周期自動調整光柵的方向和探測器的方向和位置,來確保Littrow條件滿足。第二個例子,我們討論了Littrow配置下使用光柵的優化,目標是設計光柵
    發表于 12-25 15:35

    光波導系統光柵幾何結構優化

    | | 次我們強調了快速物理光學軟件VirtualLab Fusion分析光波導系統性能。這次我們設計工作流程處理一個密切相關的步驟: 系統
    發表于 12-20 10:27

    光波導系統光柵幾何結構優化

    快速物理光學軟件VirtualLab Fusion擁有分析光波導系統性能。這次我們設計工作流程處理一個密切相關的步驟: 系統的耦合和擴
    發表于 12-16 10:39

    PCIe交換機與路由器的區別

    現代網絡技術PCIe交換機和路由器是兩種常見的設備,它們在數據傳輸和網絡管理中發揮著重要作用。盡管它們都與數據傳輸有關,但它們的設計、功能和應用場景有著顯著的差異。
    的頭像 發表于 11-26 16:08 ?288次閱讀

    pcie深度學習的應用

    主機系統連接,提供必要的計算支持。 2. PCIe技術概述 PCIe是一種點對點串行連接,用于計算機內部硬件組件之間的連接。它以其高速數據傳輸能力和低延遲特性而聞名,是連接高性能硬件
    的頭像 發表于 11-13 10:39 ?410次閱讀

    主板上優化PCIe通道設置

    主板上優化PCIe通道設置是提升系統性能的重要步驟,以下是具體的優化建議: 一、了解主板和PCIe
    的頭像 發表于 11-06 09:30 ?2255次閱讀

    以太交換模式有哪幾種

    以太交換模式是指以太交換機在數據傳輸過程中所采用的處理和轉發數據幀的方式。以太交換機作為局
    的頭像 發表于 10-08 10:12 ?954次閱讀

    如何簡化PCIe 6.0交換機的設計

    由于全球數據流量呈指數級增長,PCIe 6.0 交換機的市場需求也出現了激增。PCIe 6.0 交換高性能計算(HPC)
    的頭像 發表于 07-05 09:45 ?574次閱讀
    如何簡化<b class='flag-5'>PCIe</b> 6.0<b class='flag-5'>交換</b>機的設計

    FPGA的PCIE接口應用需要注意哪些問題

    ,并進行了充分的測試和優化主機系統性能 : 主機系統的處理能力和總線架構也會對PCIe設備
    發表于 05-27 16:17

    PCIe交換芯片的簡單介紹

    PCIe交換芯片是用于實現高速、低延遲的設備互聯的關鍵組件。它們現代計算機系統,尤其是高性能服務器、數據中心、存儲解決方案和高速通信系統
    的頭像 發表于 03-26 15:15 ?2850次閱讀

    pcie交換芯片的發展前景

    PCIe交換芯片的發展前景看起來相當積極,這主要得益于大數據、物聯網、人工智能等信息技術的快速發展以及傳統產業數字化的轉型。這些趨勢都推動了PCIe交換芯片的需求不斷增加,進而為其帶來
    的頭像 發表于 03-18 14:03 ?1019次閱讀

    PCIE交換芯片是什么

    PCIE交換芯片,全稱為Peripheral Component Interconnect Express交換芯片,是一種高速串行總線標準的核心組件。現代計算機架構
    的頭像 發表于 03-16 17:20 ?3476次閱讀

    【正運動】高速高精,超高實時性的PCIe EtherCAT實時運動控制卡 | PCIE464

    掉電存儲功能,可確保控制系統遭遇斷電或重啟時,關鍵數據不會丟失,提高了系統的可靠性。 9、掉電中斷PCIE464控制卡內置掉電中斷功能,當CPU
    發表于 01-24 09:48

    華為新專利降低數據交換網絡能耗和成本

    據專利摘要介紹,這項發明涉及通訊技術領域,旨在降低數據交換網絡的耗能、成本及設備尺寸。其核心部分是一款包含多個交換晶粒以及與其有直接或間接關聯的多個網絡處理晶粒的通信芯片。
    的頭像 發表于 01-19 14:14 ?662次閱讀
    華為新專利降低數據<b class='flag-5'>交換網</b>絡能耗和成本

    以太交換芯片發展分析

    本文來自“商用交換芯片國產替代加速(2024)”,以太交換機對外提供高速網絡連接端口,每個端口直接與主機或網絡節點相連,能夠同時連通對端
    的頭像 發表于 01-10 10:14 ?2230次閱讀
    以太<b class='flag-5'>網</b><b class='flag-5'>交換</b>芯片發展分析
    主站蜘蛛池模板: 亚洲视频中文字幕| 婷婷久久无码欧美人妻| 国产精品嫩草影院在线观看免费 | 久草在线新是免费视频| 国产精品亚洲专一区二区三区| RUNAWAY韩国动漫免费网| 91国在线视频| 91桃色污无限免费看| 最近更新2019中文字幕免费 | 草神被爆漫画羞羞漫画| 99九九99九九九视频精品| 2019在秋霞理论| 综合网伊人| 18禁止观看免费私人影院| 中文字幕一区二区视频| 正在播放久久| 999zyz色资源站在线观看| 98久久人妻少妇激情啪啪| 91国内精品久久久久免费影院| 18禁三级黄| 99精品免费在线观看| a视频在线看| 成年人视频在线免费| 俄罗斯一级毛片aaaa| 国产高清美女一级毛片久久| 国产精品久久久久久52AVAV| 国产欧美精品国产国产专区| 国内精品不卡一区二区三区| 精品人伦一区二区三区潘金莲| 久久99re热在线观看视频| 久久影院中文字幕| 免费鲁丝片一级在线观看| 欧美一区二区高清| 骚妇BB双飞插| 鸭子玩富婆流白浆视频| 一二三四在线观看高清电视剧| 最近的中文字幕免费完整| chinesetoilet美女沟| 高清欧美性猛交xxxx黑人猛交| 国产人妖一区二区| 久久99综合国产精品亚洲首页|