在CPU+GPU協同計算中,CPU和GPU的計算能力不同,靜態地給CPU和GPU劃分任務會導致CPU和GPU計算不同步,導致嚴重的負載不均衡,為了實現CPU和GPU的負載均衡,需要對CPU和GPU不同的劃分方法。把每個節點上的所有CPU看成一個設備,每塊GPU卡看成一個設備,對集群節點上的所有CPU設備和GPU設備分別編號,每個節點上有M塊GPU卡,N個節點上共有N個CPU設備,編號為1,2,…,N;N個節點上共有M*N個GPU設備,編號為1,2,…,M*N。
設備編號之后就可以對設備進行分組,根據算法的要求,有些任務不能細分,一個CPU設備或GPU設備上可用的內存空間可能不能滿足計算的內存要求,需要多設備數據劃分、共同計算,這時需要根據CPU內存或GPU內存進行分組
1)根據CPU內存大小和計算對內存的要求可以計算得到一組內的CPU設備數目為GC個, GC=(Mcom+MemC-1)/MemC,其中一個節點的內存大小為MemC,每個計算任務需要的內存大小為Mcom。
所有的CPU設備分為N/GC個組,每個組計算同一個任務,組內的CPU設備再進行數據劃分,數據劃分采用靜態的劃分,因為組內的CPU設備計算能力一致;
2)根據GPU內存大小和計算對內存的要求可以計算得到一組內的GPU設備數目為GG個, GG=(Mcom+MemG-1)/Mem,其中,一個GPU設備的內存大小為MemG,每個計算任務需要的內存大小為Mcom。
所有的GPU設備分為M*N/GG個組,每個組計算同一個任務,組內的GPU設備再進行數據劃分,數據劃分采用靜態劃分的方法。
CPU和GPU設備分組之后,就可以把任務動態分劃分給每個CPU組或GPU組,可以采用MPI通信進行劃分,由主進程進行動態的發送任務編號給各個CPU組或GPU組內的組長,組長再把任務編號廣播給組內的組員,然后組內的設備同時計算,計算完畢之后即可向主進程請求下一個任務,直到所有任務計算完畢為止。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
原文標題:CPU+GPU集群計算中的一種動態負載均衡設計方法
文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。
相關推薦
的整體性能,特別是在處理大量數據或運行復雜程序時,如視頻編輯、3D渲染和高端游戲等場景。快速的內存可以縮短CPU和內存之間的通信時間,從而提升整體系統的響應效率。 二、多任務處理能力
發表于 11-20 14:25
?601次閱讀
) 操作系統會將部分內存數據暫時存儲到硬盤上,這個過程稱為頁面交換。如果頻繁發生,說明內存不足。 高CPU使用率 由于內存不足,CPU需要花
發表于 11-11 09:53
?790次閱讀
北橋芯片,也被稱為內存控制器或系統控制器,是計算機主板上的一個重要組成部分。它負責管理CPU、內存、以及其他系統組件之間的數據傳輸和通信。 1. 北橋芯片的定義和功能 北橋芯片是主板上
發表于 10-14 10:37
?493次閱讀
Windows操作系統提供了多種方式來管理內存,以確保系統資源的有效利用和性能的優化。以下是關于Windows管理內存的三種主要方式的詳細闡述,包括堆
發表于 10-12 17:09
?706次閱讀
前端總線(FSB)與內存頻率的配合是確保計算機系統穩定運行并發揮最佳性能的關鍵因素之一。以下是對前端總線與內存頻率配合關系的介紹: 一、前端總線與內存頻率的基本概念 前端總線 :前端總線是CP
發表于 10-12 09:10
?251次閱讀
電子發燒友網站提供《C2000 CPU內存內置自檢功能.pdf》資料免費下載
發表于 10-10 09:27
?0次下載
內存控制器是計算機系統內部控制內存并負責內存與CPU之間數據交換的重要組成部分。它不僅是連接CPU與內存
發表于 09-04 14:19
?702次閱讀
應用場景和目的反射內存卡:主要用于需要多個設備或系統之間進行高速、實時數據共享和通信的場景,例如工業控制、航空航天等領域。普通內存卡:通常用于個人電子設備,如手機、相機、平板電腦等,用
發表于 09-04 10:24
?598次閱讀
主板內存故障燈亮并不一定是CPU的問題,但CPU與內存之間的交互確實可能影響這一故障現象。以下是對主板內存故障燈亮可能原因的分析: 一、
發表于 09-02 14:42
?2669次閱讀
檢查CPU安裝 :確保CPU正確安裝在主板上,接觸良好。 檢查散熱 :確保CPU散熱器安裝正確,沒有松動,且散熱膏涂抹均勻。 檢查電源 :確保電源線連接正確,電源供應穩定。 1.2 內存
發表于 09-02 14:38
?9711次閱讀
DevEco Studio集成的DevEco Profiler性能調優工具(以下簡稱為Profiler),提供Time、Allocation、Snapshot、CPU等場景化分析任務類型。內存快照
發表于 05-11 13:51
HBM全稱為High Bandwidth Memory,直接翻譯即是高帶寬內存,是一款新型的CPU/GPU內存芯片。
發表于 04-20 15:27
?1535次閱讀
傳輸方式常見于需要將外設采集的數據快速傳輸到內存進行處理的應用。 ? 內存和內存之間 :例如在兩個不同的數組之間傳輸數據,或者在不同的
發表于 02-28 16:48
?933次閱讀
大規模數據集時比CPU更快的根本原因。內存帶寬:GPU的內存帶寬比CPU高得多。內存帶寬是指數據
發表于 01-26 08:30
?2395次閱讀
系統內存和運行內存都是計算機中重要的概念,它們在計算機的存儲和運行方面起著不可或缺的作用。雖然它們與計算機存儲和運行息息相關,但是它們具有不同的功能和實現方式。接下來我將詳細介紹系統內存
發表于 01-15 16:32
?3332次閱讀
評論