在今年的 Hot Chips 2017 會議上,微軟推出基于 FPGA 的超低延遲計算平臺 Brainwave,用于在云端加速深度學習。該平臺采用英特爾 Stratix 10 FPGA,經測試得出,Brainwave 不需要任何 batching 就能在大型 GRU(Gated recurrent unit)上達到 39.5 Teraflops 的性能。
微軟將 DPU 或者 DNN 處理單元合并到 FPGA 中,希望通過加強深度學習網絡的研究,更快地適應其云服務基礎設施建設,以應對接近于實時的運算處理需求。
同樣是在 Hot Chips 大會上,百度發布一款 256 核、基于 FPGA 的云計算加速芯片 XPU,其合作伙伴是著名 FPGA 廠商 Xilinx。XPU 的目標是在性能和效率之間實現平衡,處理多樣化的計算任務,而 FPGA 本身就擅長于處理某些特定的計算。
百度研究員歐陽劍表示:「FPGA 是高效的,可以專注于特定計算任務。傳統 CPU 擅長通用計算任務,尤其是基于規則的計算任務,同時非常靈活。GPU 瞄準了并行計算,因此有很強大的性能,XPU 則專注于計算密集型、基于多規則的多樣化計算任務,提高效率和性能,并帶來類似 CPU 的靈活性。」
近兩年隨著人工智能浪潮的到來,讓有些冷門 FPGA 又重新煥發了生機,其實各大科技廠商很早就發現了 FPGA 在 AI 領域所擁有的優勢,并開始布局。
微軟在 Hot Chips 上展示 Brainwave
早在2015 年,微軟就提出了一種使用 FPGA 加速 Bing 搜索引擎的方案,這些 CPU + FPGA 混合器在當年便投入了生產和布置,用以加速 Bing 的頁面排名功能。去年,亞馬遜 AWS 也推出了基于 FPGA 的云服務 EC2 F1。事實上,百度、阿里云、騰訊云等巨頭也相繼推出了 FPGA 云服務。
FPGA 之所以普遍受到業界的關注,是源于 2015 年英特爾有史以來最大的一筆收購案 —— 以 167 億美元的價格收購 FPGA 大廠 Altera。英特爾判斷, 2020 年 CPU + FPGA 的異構計算將占據運輸局中心市場的三分之一。
和傳統的 CPU 、GPU 相比,FPGA 無指令、無需共享內存的體系結構可以擁有更高的計算效率,在處理類似矩陣運算、圖像處理、機器學習、壓縮、Bing 搜索排序等計算密集型任務中有相當優秀的表現。另外,FPGA 擁有更低的功耗,百度在線上服務使用的 FPGA 版百度大腦,在同樣的功耗下,其性能是天河二號超級計算機的十倍以上。
摩爾定律已經不再符合現今技術的發展狀態,而機器學習和 Web 服務的規模卻以指數級增長,技術和行業的快速發展,對處理器提出了可被重新編程以適應新類型計算任務的要求,FPGA 正是這樣一種可以重構的體系結構,而這也是各科技巨頭如此看重 FPGA 的原因。
-
FPGA
+關注
關注
1629文章
21729瀏覽量
603018 -
gpu
+關注
關注
28文章
4729瀏覽量
128897 -
AI
+關注
關注
87文章
30747瀏覽量
268900 -
人工智能
+關注
關注
1791文章
47200瀏覽量
238271 -
機器學習
+關注
關注
66文章
8408瀏覽量
132568
原文標題:CPU+GPU 搞不定的機器學習問題,微軟和百度都采用 FPGA 解決
文章出處:【微信號:shenzhenware,微信公眾號:深圳灣】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論