All Programmable技術和器件的全球領先企業賽靈思公司 (NASDAQ: XLNX) 宣布,其面向OpenCL、C和C++ 的SDAccel 開發環境現已順利通過 Khronos OpenCL 1.0標準一致性測試。
OpenCL標準為軟件開發人員提供了一個統一的編程環境,使其能夠編寫高效且可移植的代碼,從而能夠在賽靈思FPGA上輕松加速各種算法。作為賽靈思SDx系列的最新成員,SDAccel包含一個面向OpenCL、C和C++語言的架構最優化編譯器,且實踐證明SDAccel相對于CPU或GPU將單位功耗性能提高達25倍,性能和資源利用率更是其他FPGA解決方案的3倍。
SDAccel開發環境結合了業界首款支持OpenCL、C和C++的架構最優化編譯器與多種庫、開發板,更為FPGA帶來完全類似CPU/GPU的開發和運行時間體驗。
Khronos 組織總裁兼OpenCL工作組主席Neil Trevett 表示:“看到賽靈思對于異構系統并行編程OpenCL標準的支持,我們非常興奮。FPGA天然適用于計算密集型算法,在這類算法中,高吞吐量、低時延和低功耗是滿足系統要求的關鍵。現在整個OpenCL設計群體都能夠毫無障礙地獲益于賽靈思FPGA所帶來的優勢。”
您可能不知道的一些SDAccel的事情:
中國最大的搜索引擎提供商百度現已轉用深度神經網絡(DNN)處理技術來解決語音識別、圖像搜索以及自然語言處理中存在的各種問題。公司迅速決策到當在線預測使用神經反向傳播算法時,FPGA 解決方案遠比 CPU 和 GPU 更容易進行擴展。百度開發的 400Gflop 軟件定義加速器,其所用的賽靈思 Kintex-7 480t-2l PCI Express FPGA開發板可以插入到任何類型的 1U 或 2U 服務器中。在不同工作負載下,百度發現Kintex 7 FPGA 開發板的性能均比 GPU 高出 4 倍,比 CPU 則高出 9 倍,同時在實際生產系統中功耗僅為 10-20W。百度指出應用 FPGA 解決方案的一大壁壘就是開發時間長,百度建議利用 Xilinx SDAccel 環境提供的相應軟件工具來解決這個問題。
板級超級計算機專家Convey Computer將 x86 CPU 與賽靈思 FPGA 完美結合,設計了一款可幫助數據中心服務器進行內容高速緩存的 Wolverine 加速卡。Convey 與戴爾的數據中心解決方案(DCS)業務部通力合作推出了一款圖像縮放解決方案(在社交媒體和圖片存儲網絡中非常需要)。該解決方案采用兩個 Virtex7 開發板,相對僅采用 CPU 的同等系統而言,縮放速度可提高 35 到 40 倍。此外,Convey-Dell 解決方案之所以得到廣泛使用,關鍵還是能夠利用更高級的語言定制 FPGA 加速器。
大型數據中心需要令人信服的 FPGA 實用功能,微軟的案例就是一個有力的證明。在2014 年年初,微軟啟動了一項計劃 —使用 FPGA 加速 Bing 搜索排名。微軟公司服務器工程副總裁 Kushadra Vaid 最近在 Linley 處理器大會上的一次主題演講中展示了使用 1632 臺帶 PCIe FPGA 加速卡的服務器試生產結果。相對于未加速的服務器,微軟實現方案的吞吐量提高了 2 倍,而時延和成本分別降低了 29% 和 30%。盡管 Vaid 展示了 ASIC 可以提供極高的效率,但他表示他們根本無法趕上快速變化的需求。一直阻礙 FPGA 在這些數據中心應用中更廣泛使用的原因就是缺乏一款高效優化的編譯器和相關開發環境,以滿足數十年在面向通用 CPU 和 GPU 架構的編譯器上工作的需求。
賽靈思從事特定領域規范環境的開發工作將近十年了。數據中心管理人員和服務器/交換機 OEM 廠商對數據中心性能的關注有助于推動向統一環境縱深發展,從而在數據中心應用中實現設計優化。因此,用于加速的軟件定義開發環境 SDAccel 應運而生。
這款編譯器不僅可完成用戶在任何本地 OpenCL 編譯器上所能實現的基本功能,如循環合并、扁平化以及展開等,而且還能執行一些更高級的優化工作,如內存使用、數據流、循環流水線等選項。這些優化讓客戶依賴編譯器將 C、C++ 或 OpenCL 直接高效導入到 FPGA 硬件中。
-
賽靈思
+關注
關注
32文章
1794瀏覽量
131410 -
開發環境
+關注
關注
1文章
229瀏覽量
16665
發布評論請先 登錄
相關推薦
評論