色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

OrionX AI芯片計算資源池化技術

智能計算芯世界 ? 來源:智能計算芯世界 ? 2023-07-10 14:48 ? 次閱讀

作為 AI 市場中的重要組成,以 GPUFPGA 等為主的 AI 加速器市場發展也隨之水漲船高。GPU 資源池化技術從初期的簡單虛擬化,到資源池化,經歷了四個技術演進階段。

?簡單虛擬化。將物理 GPU 按照 2 的 N 次方,切分成多個固定大小的 vGPU(Virtual GPU,虛擬 GPU),每個 vGPU 的算力和顯存相等。實踐證明,不同的 AI 模型對于算力、顯存資源的需求是不同的。所以,這樣的切分方式,并不能滿足 AI 模型多樣化的需求。

?任意虛擬化。將物理 GPU 按照算力和顯存兩個維度,自定義切分,獲得滿足 AI 應用個性化需求的 vGPU。

?遠程調用。AI 應用與物理 GPU 服務器分離部署,允許通過高性能網絡遠程調用 GPU資源。這樣可以實現 AI 應用與物理 GPU 資源剝離,AI 應用可以部署在私有云的任意位置,只需要網絡可達,即可調用 GPU 資源。

?資源池化。形成 GPU 資源池后,需要統一的管理面來實現管理、監控、資源調度和資源回收等功能。同時,也需要提供北向 API,與數據中心級的資源調度平臺對接,讓用戶在單一界面,就可以調度包括 vGPU 在內的數據中心內的各類資源。

OrionX 通過軟件定義 AI 算力,顛覆了原有的 AI 應用直接調用物理 GPU 的架構,增加軟件層,將 AI 應用與物理 GPU 解耦合。AI 應用調用邏輯的 vGPU,再由 OrionX 將 vGPU需求匹配到具體的物理 GPU。OrionX 架構實現了 GPU 資源池化,讓用戶高效、智能、靈活地使用 GPU 資源,達到了降本增效的目的。

b492344e-1ec8-11ee-962d-dac502259ad0.png

一個典型的 OrionX GPU 資源池的邏輯架構中包含了 OrionX Controller(OC)、OrionX Server Service(OSS)、OrionX Client Runtime(OCRT)、和 OrionX GUI(OG)等功能組件。

OrionX 的各功能組件可以根據用戶環境需求被部署在單服務器上,也可以被分布式地部署在數據中心的多個物理機、虛擬機或者容器環境中。在分布式的部署環境中,各功能組件可以通過多種類型的網絡建立連接,從而把數據中心的 GPU 資源管理起來,形成一種可以被全局共享的計算資源,對 AI 應用提供可遠程訪問的、可靈活切分的、可聚合的彈性 GPU算力。OrionX 的邏輯架構如下圖所示。

b4ec7800-1ec8-11ee-962d-dac502259ad0.png

CUDA是由 Nvidia 公司定義且公開推廣、維護的一種 GPU 編程接口。從 2007 年推出之后,經過十幾年生態培育,已經成為 GPU 編程的一個事實標準。大部分流行的 AI 框架,例如 TensorFlow、PyTorch、MXNet 和 PaddlePaddle都是基于 CUDA 編程接口開發。

OrionX 在管理物理 GPU 之后,通過模擬 CUDA 標準接口,為各種 AI 應用提供一個與 Nvidia CUDA SDK 接口功能一致的運行環境,從而使得 AI 應用透明無感知地運行在 OrionX GPU資源池之上。OrionX 不僅在單服務器上模擬了 CUDA 標準接口,并且通過分布式部署各功能組件,能夠提供分布式的 CUDA 運行環境。

OrionX 的各個功能組件通過管理平面網絡和數據平面網絡進行通信,共同完成 GPU 資源池的管理以及 GPU 資源的調度等功能。

在部署 OrionX 時,使用基于 TCP/IP 網絡的管理平面,來承載整個系統的管理工作。通過管理網絡,分布在各個節點的功能組件都保持和 OrionX Controller 同步。管理平面邏輯結構如下圖所示。

b51a473a-1ec8-11ee-962d-dac502259ad0.png

在應用運行的過程中,應用所在環境和 GPU 物理節點之間的數據傳輸使用的是 OrionX 的數據面。該數據面支持多種后端數據傳輸載體,包括 TCP/IP 以太網絡、RoCE RDMA、Infiniband RDMA、Share Memory 等。具備高帶寬、低延遲。同時支持多種傳輸協議,根據優先級自動使用高性能的傳輸方式。支持虛擬機、容器和宿主機之間的 TCP/IP 網絡隔離。

b5432fb0-1ec8-11ee-962d-dac502259ad0.png

OrionX 的各個組件,支持直接部署在裸金屬服務器上,即安裝操作系統后,直接以 Binary形式部署,也支持容器化部署。OrionX 具備適配多種 Linux 操作系統和云平臺的能力,因此,OrionX 具有多樣化的部署形式。

OrionX 支持 CentOS、Ubuntu、Debian 等 Linux 發行版本,同時支持基于 KVM 的虛擬機云平臺和基于 Docker 的容器云平臺。尤其是支持原生容器,并實現了和 Kubernetes 的平滑對接。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1629

    文章

    21754

    瀏覽量

    604233
  • 服務器
    +關注

    關注

    12

    文章

    9231

    瀏覽量

    85625
  • AI芯片
    +關注

    關注

    17

    文章

    1890

    瀏覽量

    35097

原文標題:OrionX AI芯片計算資源池化技術

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NanoEdge AI技術原理、應用場景及優勢

    NanoEdge AI 是一種基于邊緣計算的人工智能技術,旨在將人工智能算法應用于物聯網(IoT)設備和傳感器。這種技術的核心思想是將數據處理和分析從云端轉移到設備本身,從而減少數據傳
    發表于 03-12 08:09

    AI發展對芯片技術有什么影響?

    現在說AI是未來人類技術進步的一大方向,相信大家都不會反對。說到AI芯片技術的關系,我覺得主要體現在兩個方面:第一,
    發表于 08-12 06:38

    平頭哥劍CDK 更新重磅來襲!三大亮點速看!

    芯片的開發。劍CDK概覽一、劍CDK基本介紹劍CDK在產品設計中,分為四個部分:Packages:組件模塊;用于支撐劍
    發表于 09-01 15:00

    OpenHarmony3.1 Release版本特性解析——OpenHarmony硬件資源架構介紹

    ,實現硬件互助、資源共享,為用戶提供流暢的全場景體驗。本期,我們通過介紹 OpenHarmony 的硬件資源框架,為大家揭曉 OpenHarmony 是如何實現多設備協同的。一、硬
    發表于 05-23 16:42

    電力云資源的建立

    國家電網公司從2010年開始建設電力云資源,存儲域作為資源的必須部分,設計和實現存儲域是資源
    發表于 11-27 17:33 ?0次下載
    電力云<b class='flag-5'>資源</b><b class='flag-5'>池</b>的建立

    華為視頻云平臺通過云技術實現計算、網絡、存儲資源

    華為視頻云的支撐框架為云平臺FusionCloud,可承建北京城市副中心行政辦公區的視頻監控系統,構建計算、存儲等資源適配視頻的應用業務,通過基于主流開放的OpenStack架構的云虛擬
    的頭像 發表于 12-14 16:35 ?8171次閱讀

    OpenHarmony硬件資源模型

    在設計初期,為解決兩臺設備間的協同問題,我們通過 OpenHarmony 提供的分布式設備虛擬能力將兩臺設備的硬件資源進行融合,實現了“一對一”的硬件資源訪問。這便是硬件資源
    的頭像 發表于 05-11 10:24 ?1539次閱讀

    什么是內存

    1什么是內存 1.1技術 所謂“技術”,就
    的頭像 發表于 11-08 16:26 ?918次閱讀
    什么是內存<b class='flag-5'>池</b>

    了解連接、線程、內存、異步請求

    技術 技術能夠減少資源對象的創建次數,提?程
    的頭像 發表于 11-09 14:44 ?1392次閱讀
    了解連接<b class='flag-5'>池</b>、線程<b class='flag-5'>池</b>、內存<b class='flag-5'>池</b>、異步請求<b class='flag-5'>池</b>

    內存主要解決的問題

    內存的定義 1.技術 是在計算機技術中經常使用的一種設計模式,其內涵在于:將程序中需要
    的頭像 發表于 11-13 15:23 ?730次閱讀
    內存<b class='flag-5'>池</b>主要解決的問題

    技術的應用實踐

    作為一名Java開發人員,技術或多或少在業務代碼中使用。常見的包括線程、連接等。也是因為Java語言超級豐富的基建,基本上這些
    的頭像 發表于 11-24 10:22 ?539次閱讀
    <b class='flag-5'>池</b><b class='flag-5'>化</b><b class='flag-5'>技術</b>的應用實踐

    優刻得與聯想AI實驗室攜手共建高效AI資源

    近日,云計算服務提供商優刻得(UCloud)與聯想AI實驗室宣布達成戰略合作,雙方將共同打造一個高效且靈活的本地AI資源
    的頭像 發表于 07-14 14:19 ?1105次閱讀

    打造異構計算新標桿!國數集聯發布首款CXL混合資源參考設計

    今日,領先的高速互聯芯片及方案設計廠商國數集聯發布業界首創的CXL混合資源(Compute Express Link Hybrid Resource Pool ,以下簡稱“CHRP”)參考設計。該
    的頭像 發表于 08-06 14:19 ?336次閱讀
    打造異構<b class='flag-5'>計算</b>新標桿!國數集聯發布首款CXL混合<b class='flag-5'>資源</b><b class='flag-5'>池</b>參考設計

    AI云端計算資源有哪些類型

    AI云端計算資源涵蓋了從基礎設施到軟件服務的多個層面,為AI模型的訓練、推理和部署提供了強大的支持。下面,AI部落小編為您詳細介紹
    的頭像 發表于 11-15 09:39 ?175次閱讀

    AI云端計算資源的多維度優勢

    AI云端計算資源,作為AI技術與云計算深度融合的產物,在成本效益、性能優化、數據安全、靈活擴展以
    的頭像 發表于 01-07 11:11 ?56次閱讀
    主站蜘蛛池模板: bbbbbxxxxx肥胖| 女人张开腿让男人桶爽免| 麻豆XXXX乱女少妇精品| 日本久久久| 亚洲午夜精品久久久久久抢| good神马电影伦理午夜| 护士日本ⅹxxx丰满hd| 日本高清免费一本视频在线观看| 一边捏奶头一边啪高潮会怎么样| 国产AV一区二区三区日韩| 美女内射视频WWW网站午夜| 午夜亚洲国产理论片二级港台二级 | 男女久久久国产一区二区三区| 亚洲福利精品电影在线观看| youjizz护士| 考好老师让你做一次H| 亚洲AV国产国产久青草| 扒开她的黑森林让我添动态图| 老男人粗大猛| 亚洲日本va中文字幕久久| 国产精品单位女同事在线| 欧美精品九九99久久在观看| 月夜直播免费看| 国产亚洲精品在浅麻豆| 色婷婷五月综合中文字幕 | 大相蕉伊人狼人久草av| 免费在线观看a视频| 优优色影院| 极品少妇高潮啪啪无码吴梦| 午夜特级毛片| 高清无码中文字幕影片| 欧美人与动交zOZ0| 7756短视频| 久久精品亚洲AV中文2区金莲| 亚洲国产无线码在线观看| 国产高清视频在线观看不卡v | 日本一在线中文字幕| 99国内精品久久久久久久清纯| 久久亚洲精品AV成人无| 一本道久在线综合道| 黄色网址在线看|