關(guān)于OpenCL
OpenCL是Open Computing Language的簡寫,目前已經(jīng)形成了標(biāo)準(zhǔn),是跨平臺的,通常由圖形處理器(GPU)提供硬件層面支持。OpenCL的設(shè)計目的,主要是為了將GPU強大的浮點和并行運算能力,以及能與CPU協(xié)作的能力,從軟件層面開放給用戶使用。用法跟OpenGL類似。
通常情況下,對同一組數(shù)據(jù)進行并行運算,使用OpenCL比執(zhí)行普通CPU端程序,要快很多倍。
站在應(yīng)用軟件的角度,OpenCL簡單來說,就是一組API函數(shù)名稱,操作系統(tǒng)通常會提供具體實現(xiàn)庫,以及運行于GPU之上的程序(OpenCL中稱為kernel),文件后綴通常為.cl,基于OpenCL語法編寫的程序,由CPU加載編譯后,傳輸?shù)絆penCL設(shè)備的內(nèi)存供GPU執(zhí)行。各個圖形處理器廠商,針對自己的具體芯片,在GPU驅(qū)動程序中適配這些API,用戶就可以基于這些標(biāo)準(zhǔn)的API進行相關(guān)的OpenCL應(yīng)用程序開發(fā)。
需要指出的是:跟OpenGL的shader程序類似,OpenCL的kernel程序也是具體GPU芯片相關(guān)的,不能跨GPU型號使用。同一段代碼,可能換了GPU型號之后就不能編譯通過,第一個GPU使用的二進制kernel程序,不應(yīng)該直接加載到第二個不同型號GPU上面使用。
OpenCL應(yīng)用運行框圖
OpenCL設(shè)備內(nèi)部,通常會有大量的并行計算單元(上圖中的CU),每個計算單元內(nèi)部又包含有若干個處理單元(圖中的PE),PE可以同時并行地執(zhí)行相同OpenCL代碼,從而實現(xiàn)高性能并行運算,具體CU以及PE數(shù)量已經(jīng)運算性能,跟具體GPU廠商的具體GPU型號有關(guān)。
OpenCL代碼被CPU加載到設(shè)備內(nèi)存之后,CPU通過相應(yīng)的OpenCL API來啟動OpenCL設(shè)備的運行,同時還能查詢執(zhí)行狀態(tài),實現(xiàn)CPU-GPU之間的同步,設(shè)備關(guān)閉等操作。
RZ/G2L上的OpenCL支持
RZ/G2L微處理器配備Cortex-A55(1.2 GHz)CPU、16 位 DDR3L/DDR4接口、帶Arm Mali-G31的3D圖形加速引擎以及視頻編解碼器(H.264),如下圖紅色框所示。此外,這款微處理器還配備有大量接口,如攝像頭輸入、顯示輸出、USB 2.0和千兆以太網(wǎng),因此特別適用于入門級工業(yè)人機界面(HMI)和具有視頻功能的嵌入式設(shè)備等應(yīng)用。
此GPU支持2D/3D圖形,以及通用GPU運算(GPGPU)。具體支持如下標(biāo)準(zhǔn)API:
● OpenCL 2.0 Full Profile
●OpenGL ES 1.1 2.0 3.0 3.1 and 3.2
RZ/G2L上的OpenCL Library及其使用
RZ/G2L的VLP開發(fā)環(huán)境里面有提供Linux版OpenCL Library(需要從官網(wǎng)另外下載)以及對應(yīng)頭文件。
RZ/G2L的OpenCL庫支持3種運行模式:
● CPU Mode:并行運算在CPU端完成,應(yīng)用程序仍然需要調(diào)用OpenCL庫API,OpenCL庫內(nèi)部會基于ARMv8 NEON SIMD指令集做針對性優(yōu)化。
● GPU Mode:并行運行在GPU端完成,驅(qū)動程序會充分利用OpenCL設(shè)備的PE單元,提示并行性和運算效率。
● BOTH Mode:上面兩種模式的結(jié)合。
通常情況下,BOTH Mode能提供最佳性能,典型做法是將待處理的并行數(shù)據(jù),平均分成連續(xù)的兩部分,CPU和GPU各自處理一半的數(shù)據(jù)(BOTH模式)。結(jié)合CPU模式,是因為CPU端有高主頻,大Cache,高DDR帶寬等優(yōu)勢。由于GPU端PE的特殊性,對待處理的數(shù)據(jù),要求是,所有輸入數(shù)據(jù)運算方法相同,沒有依賴性,比如:兩組輸入數(shù)組A[1024]和B[1024]分別存放有1024字節(jié)的float類型數(shù)據(jù),將A和B同序號的數(shù)據(jù)分別做乘法,結(jié)果保存于浮點數(shù)組C[1024],即:
C[0] = A[0] * B[0];
C[1] = A[1] * B[1];
… …
因為所有PE只能并行執(zhí)行相同的kernel程序。
OpenCL庫的使用,主要分為如下步驟:
●獲取平臺信息
●獲取設(shè)備信息
●創(chuàng)建上下文
●創(chuàng)建命令隊列
●創(chuàng)建和編譯kernel程序
●創(chuàng)建kernel對象
●創(chuàng)建內(nèi)存對象
●設(shè)置kernel參數(shù)
●執(zhí)行kernel程序
●同步操作
●獲取處理結(jié)果
●清理資源
部分OpenCL API介紹
OpenCL API通常以 cl_ 開頭,很容易識別。
獲取平臺信息
cl_int clGetPlatformIDs(cl_uint num_entries,
cl_platform_id *platforms,
cl_uint *num_platforms);
這個函數(shù)是OpenCL應(yīng)用程序必須調(diào)用的第一個API,用來獲取可使用的Platform ID數(shù)組,當(dāng)平臺數(shù)未知時,第一次調(diào)用clGetPlatformIDs函數(shù)獲取平臺數(shù)量,第二次調(diào)用clGetPlatformIDs函數(shù)獲取平臺對象,供后續(xù)API使用。
cl_int clGetPlatformInfo(cl_platform_id platform,
cl_platform_info param_name,
size_t param_value_size,
void *param_value,
size_t *param_value_size_ret);
用于獲取OpenCL的Profile信息、版本、平臺制造商、支持的擴展等。
獲取設(shè)備信息
cl_int clGetDeviceIDs(cl_platform_id_platform,
cl_device_type device_type,
cl_uint num_entries,
cl_device_id *devices,
cl_uint *num_devices);
這個API用來獲取平臺可使用的設(shè)備對象數(shù)組。可用于獲取CPU/GPU/專用加速器等OpenCL設(shè)備數(shù)量等。
cl_int clGetDeviceInfo(cl_device_id device,
cl_device_info param_name,
size_t param_value_size,
void *param_value,
size_t *param_value_size_ret);
用于獲取選定設(shè)備相關(guān)信息,如并行計算單元最大數(shù)量、設(shè)備端全局內(nèi)存大小等信息。
由于OpenCL API涉及的內(nèi)容比較多,另一方面,OpenCL相關(guān)標(biāo)準(zhǔn)已經(jīng)很成熟,網(wǎng)上有很多的示例資源可供參考,瑞薩也可以提供MPU上的OpenCL例子給到客戶,剩下的OpenCL應(yīng)用程序步驟相關(guān)API,就不進一步介紹了。
審核編輯:劉清
-
微處理器
+關(guān)注
關(guān)注
11文章
2300瀏覽量
83045 -
圖形處理器
+關(guān)注
關(guān)注
0文章
202瀏覽量
25774 -
視頻編解碼器
+關(guān)注
關(guān)注
0文章
18瀏覽量
11639 -
OpenCL
+關(guān)注
關(guān)注
2文章
48瀏覽量
33467 -
GPU芯片
+關(guān)注
關(guān)注
1文章
304瀏覽量
5983
原文標(biāo)題:RZ/G2L OpenCL使用介紹
文章出處:【微信號:瑞薩MCU小百科,微信公眾號:瑞薩MCU小百科】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
【飛凌RZ/G2L開發(fā)板試用體驗】+01.開箱(zmj)
瑞薩G2L系列核心板-RZ/G2L處理器簡介
RZ/G2L RZ/G2LC RZ/G2UL RZ/G3S靈活軟件包應(yīng)用說明

評論