在 CacheQ 編譯器集合中,編譯器消除了手動代碼重寫和使用線程庫或復雜的并行執行 API,如 OpenMP 或 MPI。它采用單線程 C 代碼并生成可在 CPU 上運行的可執行文件,利用帶或不帶超線程的物理 x86 內核以及 Arm 和 RISC-V 內核。
使用 CacheQ 靈活的編譯器,用戶可以為相同或不同架構上的多核處理器生成代碼,并使用運行時變量對使用情況進行基準測試。它們可以添加到硬件以提高性能和功耗,或減少內核數量并分配其他進程以實現每瓦功耗的更優化性能。
根據該公司的說法,基于模擬股票交易中人類行為的 Black Scholes 金融算法的基準,結果是在具有 12 個邏輯內核的 X86 處理器上的單線程執行速度提高了 486% 以上。具有八個 Arm 內核的 Apple M1 處理器比單線程 GNU 編譯器集合 (GCC) 快 400%。
CacheQ 使軟件開發人員能夠為包括 FPGA、CPU 和 GPU 在內的異構計算系統開發和部署定制硬件加速器。它的 CacheQ Compiler Collection 以 gcc 工具套件為模型,包括類似于常見開源編譯器的用戶界面。因為它需要有限的代碼修改,所以可以縮短開發時間并提高系統質量。
該工具套件支持對生成的虛擬引擎進行編譯、檢查和錯誤檢測、性能預測、分析、調試和可視化。它支持目標硬件,包括單核和多核處理器,以及具有連接到 x86 和 Arm 處理器的 FPGA 加速器的異構計算系統。
CacheQ 編譯器集合通過導出函數調用的“混合”訪問來支持 C 代碼和 C++。
CacheQ Compiler Collection 的其他基準測試突出了其跨越高端服務器和消費電子設備的能力。具有兩個內核的 M1 處理器的執行性能優于具有 11 個內核的 x86 芯片,顯示出每瓦成本的優勢。據該公司稱,四核 Apple M1 處理器的性能比 12 核 x86 快 210%。總體而言,它的執行速度比使用 CacheQ 編譯器集合在 x86 上運行的單線程 GCC 快約 1,476%。
所有模擬都是在為不同目標編譯的相同代碼上執行的。基準測試是在運行頻率為 3.7GHz 的 Intel i7-8700k x86 CPU 上執行的,該 CPU 具有六個物理內核和超線程,可用于運行 Ubuntu 18.04 的 12 個邏輯內核。Apple M1 基準測試是使用運行本機 Arm Ubuntu 20.04 映像的 Parallels VM 捕獲的。
審核編輯:郭婷
-
FPGA
+關注
關注
1629文章
21752瀏覽量
604118 -
C++
+關注
關注
22文章
2110瀏覽量
73696 -
編譯器
+關注
關注
1文章
1635瀏覽量
49169
發布評論請先 登錄
相關推薦
評論