電子發燒友網報道(文/周凱揚)根據EvansData全球開發調查報告22.1公布的數據,有48%的開發者著手的都是使用不止一種處理器的異構系統,因為他們需要更高效的多架構編程方案來提高負載的應用范圍。然而,像CUDA之類的專用編程模型,雖然生態成熟度更高,但缺乏移植性,所以英特爾就拿出了oneAPI這一統一開放的編程模型。
oneAPI將最大化利用英特爾的新一代硬件
去年12月,英特爾發布了全新的InteloneAPI工具2023版本,新版本的工具將支持第4代XeonScalable處理器、XeonCPU Max系列,以及英特爾的數據中心GPU,包括Flex和Max兩大系列。
oneAPI對英特爾產品線的支持/英特爾
在英特爾AMX、AQT、AVX-512和矢量引擎等硬件特性的支持下,oneAPI進一步提高了這些英特爾硬件的深度學習處理性能和效率。比如在oneAPI的深度神經網絡神經庫下,XeonMaxCPU在MLPerfDeepCAM深度學習和推理下的性能,都要高出AMD的EPYC CPU,甚至高于英偉達的A100 GPU。在OpenMC、miniBUDE等計算負載下,英特爾的Max系列GPU也能實現兩倍于英偉達A100 GPU的性能。
英特爾也開始聯合開發社區,針對Tensorflow、PyTorch、Anaconda等常用框架進行優化。根據Tensorflow官方公布的數據,在英特爾和谷歌對oneAPI的oneDNN優化下,他們得以充分利用第四代XeonScalable處理器的性能,在使用該處理內置的AMX擴展后,相較上一代處理器,不少AI模型的運行速度實現了至高19倍的提升。隨著oneAPI的oneDNN庫均已被集成到最新版的TensorFlow和PyTorch中,相信更多開發者會選擇轉投英特爾的懷抱。
對第三方GPU的支持
對于軟件開發人員來說,擺脫專有接口而轉用開放標準的話,無疑可以兼容更廣泛的平臺和架構,但實現這一點需要的開發成本并不低。在英特爾收購了Codeplay之后,其軟件開發進度也逐步加快。去年年底,Codeplay宣布擴展oneAPI對第三方API的支持,讓多架構多供應商的編程變得更加簡單,于是對于英偉達GPU和AMD GPU的oneAPI插件也就面世了。
提供給第三方GPU的oneAPI可以與英特爾的oneAPI DPC++/C++編譯器,以及諸多流行的庫無縫銜接,這樣就能將不同的處理器的編程統一到開放標準上來。但同樣需要注意的是,oneAPI對第三方GPU的支持還不算很完善,比如對于AMD GPU的支持仍處于beta測試階段。而且當下oneAPI對已知的GPU支持相當有限,比如英偉達GPU正式支持的型號有RTX2060和A100,AMD GPU正式支持的型號只有Radeon Pro W6800。
雖然Codeplay稱第一版oneAPI應該可以支持到更多的英偉達和AMD GPU,但他們并沒有在這些硬件平臺上進行測試,所以不能保證正確的運行。而且對于英偉達GPU來說,目前僅支持通用Linux系統,因為CUDA并不支持macOS,而支持Windows的版本將在未來推出。同樣的兼容性說明也適用于AMD的GPU,而且Codeplay已經在AMD MI50、MI100和RadeonRX6700XT這些GPU上進行了測試,但AMD的HIP目前并不支持Windows或macOS,所以只有Linux一種操作系統選項。
小結
對于英特爾來說,直接與聲勢浩大的CUDA正面交鋒無疑不是一個明智的選擇,可有了oneAPI這個開放編程標準,繞過乃至實現CUDA移植可以為開發者提供更大的吸引力。畢竟如今的數據中心市場硬件換代速度快,又紛紛采用了異構集成設計,如果英特爾堅持只為自己的硬件提供支持的話,那么非英特爾的CPU、GPU、FPGA和AI加速器都將繼續選擇自研或是公開的編程方案。而開放的oneAPI,在為其他硬件提供支持的前提下,充分利用英特爾硬件的核心優勢,才能做到異軍突起。
-
處理器
+關注
關注
68文章
19259瀏覽量
229657 -
英特爾
+關注
關注
61文章
9950瀏覽量
171695
發布評論請先 登錄
相關推薦
評論