AI ( 人工智能)現在完全處于圖像識別市場的主導地位,因為卷積神經網絡 (CNN) 的表現不僅遠遠超越同類競爭機器實現方案,甚至讓人類的圖像識別能力也相形見絀。基本的 CNN 算法需要大量的計算和數據重復使用,這正是 FPGA 實現方案的優勢。
賽靈思 CTO 辦公室的杰出工程師Ralph Wittig在 2016 年 OpenPOWER 峰會上做了 20 分鐘的演講,討論了 CNN 的當前技術最新發展水平以及包括清華大學等在內各個大學的一些研究結果。
這為我們帶來了幾個與 CNN 算法實現方案功耗相關且備受關注的結論:
繼續使用片上存儲器;
使用較小的乘法器;
繼續使用定點算法 — 16 位定點解析可最大限度減少與 32 位定浮點計算有關的精確度退化問題,而且如果逐層使用動態量化,8 位計算也能產生良好的結果。
詳細內容請觀看 Ralph Wittig在 OpenPOWER 峰會上的演講視頻:
在本視頻中,Wittig 還說明了兩款 CNN 相關產品的使用情況。 這兩款產品此前在Xcell Daily中有報道:
與 CAPI 兼容的 Alpha Data ADM-PCIE-8K5 PCIe 加速板。(請參見:Alpha Data 面向 x86 和 IBM Power8/9 數據中心及云服務器的 ADM-PCIE-8K5 PCIe 加速板使用 Kintex UltraScale FPGA。)
Auviz Systems 的 AuvizDNN(深度神經網絡)庫。(請參見:深入了解 AuvizSystems 的卷積神經網絡性能加速、云端的機器學習:FPGA 上的深度神經網絡以及 Auviz 圖像處理及計算機視覺庫與賽靈思 SDAccel 相配合,可為 FPGA 實現堪比 GPU 的性能。)
擴展閱讀:
Xilinx 與 IBM 攜手通過 SuperVessel 云實現 FPGA 加速
Xilinx 拓展生態系統和平臺強化嵌入式視覺和工業物聯網產品組合
面向數據中心與云服務器的 PCIe 加速卡來了!
FUTURE IS HERE!
-
賽靈思
+關注
關注
32文章
1794瀏覽量
131410 -
人工智能
+關注
關注
1793文章
47567瀏覽量
239427
發布評論請先 登錄
相關推薦
評論