看FPGA如何擊敗GPU和GPP

　　最近幾年，深度學習成為計算機視覺、語音識別、自然語言處理等關鍵領域中所最常使用的技術，被業界大為關注。然而，深度學習模型需要極為大量的數據和計算能力，只有更好的硬件加速條件，才能滿足現有數據和模型規模繼續擴大的需求。現有的解決方案使用圖形處理單元（GPU）集群作為通用計算圖形處理單元（GPGPU），但現場可編程門陣列（FPGA）提供了另一個值得探究的解決方案。日漸流行的FPGA設計工具使其對深度學習領域經常使用的上層軟件兼容性更強，使得FPGA更容易為模型搭建和部署者所用。FPGA架構靈活，使得研究者能夠在諸如GPU的固定架構之外進行模型優化探究。同時，FPGA在單位能耗下性能更強，這對大規模服務器部署或資源有限的嵌入式應用的研究而言至關重要。本文從硬件加速的視角考察深度學習與FPGA，指出有哪些趨勢和創新使得這些技術相互匹配，并激發對FPGA如何幫助深度學習領域發展的探討。

　　簡介

　　機器學習對日常生活影響深遠。無論是在網站上點擊個性化推薦內容、在智能手機上使用語音溝通，或利用面部識別技術來拍照，都用到了某種形式的人工智能技術。這股人工智能的新潮流也伴隨著算法設計的理念轉變。過去基于數據的機器學習大多是利用具體領域的專業知識來人工地“塑造”所要學習的“特征”，計算機從大量示例數據中習得組合特征提取系統的能力，則使得計算機視覺、語音識別和自然語言處理等關鍵領域實現了重大的性能突破。對這些數據驅動技術的研究被稱為深度學習，如今正受到技術界兩個重要群體的關注：一是希望使用并訓練這些模型、從而實現極高性能跨任務計算的研究者，二是希望為現實世界中的新應用來部署這些模型的應用科學家。然而，他們都面臨著一個限制條件，即硬件加速能力仍需加強，才可能滿足擴大現有數據和算法規模的需求。

　　對于深度學習來說，目前硬件加速主要靠使用圖形處理單元（GPU）集群作為通用計算圖形處理單元（GPGPU）。相比傳統的通用處理器（GPP），GPU的核心計算能力要多出幾個數量級，也更容易進行并行計算。尤其是NVIDIA CUDA，作為最主流的GPGPU編寫平臺，各個主要的深度學習工具均用其來進行GPU加速。最近，開放型并行程序設計標準OpenCL作為異構硬件編程的替代性工具備受關注，而對這些工具的熱情也在高漲。雖然在深度學習領域內，OpenCL獲得的支持相較CUDA還略遜一籌，但OpenCL有兩項獨特的性能。首先，OpenCL對開發者開源、免費，不同于CUDA單一供應商的做法。其次，OpenCL支持一系列硬件，包括GPU、GPP、現場可編程門陣列（FPGA）和數字信號處理器（DSP）。

　　作為GPU在算法加速上強有力的競爭者，FPGA是否立即支持不同硬件，顯得尤為重要。 FPGA與GPU不同之處在于硬件配置靈活，且FPGA在運行深入學習中關鍵的子程序（例如對滑動窗口的計算）時，單位能耗下通常能比GPU提供更好的表現。不過，設置FPGA需要具體硬件的知識，許多研究者和應用科學家并不具備，正因如此，FPGA經常被看作一種行家專屬的架構。最近，FPGA工具開始采用包括OpenCL在內的軟件級編程模型，使其越來越受經主流軟件開發訓練的用戶青睞。

　　對考察一系列設計工具的研究者而言，其對工具的篩選標準通常與其是否具備用戶友好的軟件開發工具、是否具有靈活可升級的模型設計方法以及是否能迅速計算、以縮減大模型的訓練時間有關。隨著FPGA因為高抽象化設計工具的出現而越來越容易編寫，其可重構性又使得定制架構成為可能，同時高度的并行計算能力提高了指令執行速度，FPGA將為深度學習的研究者帶來好處。

　　對應用科學家而言，盡管有類似的工具級選擇，但硬件挑選的重點在于最大化提高單位能耗的性能，從而為大規模運行降低成本。所以，FPGA憑借單位能耗的強勁性能，加上為特定應用定制架構的能力，就能讓深度學習的應用科學家受益。

　　FPGA 能滿足兩類受眾的需求，是一個合乎邏輯的選擇。本文考察FPGA上深度學習的現狀，以及目前用于填補兩者間鴻溝的技術發展。因此，本文有三個重要目的。首先，指出深度學習領域存在探索全新硬件加速平臺的機會，而FPGA是一個理想的選擇。其次，勾勒出FPGA支持深度學習的現狀，指出潛在的限制。最后，對 FPGA硬件加速的未來方向提出關鍵建議，幫助解決今后深度學習所面臨的問題。

　　FPGA

　　傳統來說，在評估硬件平臺的加速時，必須考慮到靈活性和性能之間的權衡。一方面，通用處理器（GPP）可提供高度的靈活性和易用性，但性能相對缺乏效率。這些平臺往往更易于獲取，可以低廉的價格生產，并且適用于多種用途和重復使用。另一方面，專用集成電路（ASIC）可提供高性能，但代價是不夠靈活且生產難度更大。這些電路專用于某特定的應用程序，并且生產起來價格昂貴且耗時。

　　FPGA是這兩個極端之間的折中。FPGA屬于一類更通用的可編程邏輯設備（PLD），并且簡單來說，是一種可重新配置的集成電路。因此，FPGA既能提供集成電路的性能優勢，又具備GPP可重新配置的靈活性。FPGA能夠簡單地通過使用觸發器（FF）來實現順序邏輯，并通過使用查找表（LUT）來實現組合邏輯。現代的FPGA還含有硬化組件以實現一些常用功能，例如全處理器內核、通信內核、運算內核和塊內存（BRAM）。另外，目前的FPGA趨勢趨向于系統芯片（SoC）設計方法，即ARM協處理器和FPGA通常位于同一芯片中。目前的FPGA市場由Xilinx主導，占據超過85％的市場份額。此外，FPGA正迅速取代ASIC和應用專用標準產品（ASSP）來實現固定功能邏輯。 FPGA市場規模預計在2016年將達到100億美元。

　　對于深度學習而言，FPGA提供了優于傳統GPP加速能力的顯著潛力。 GPP在軟件層面的執行依賴于傳統的馮？諾依曼架構，指令和數據存儲于外部存儲器中，在需要時再取出。這推動了緩存的出現，大大減輕了昂貴的外部存儲器操作。該架構的瓶頸是處理器和存儲器之間的通信，這嚴重削弱了GPP的性能，尤其影響深度學習經常需要獲取的存儲信息技術。相比較而言，FPGA的可編程邏輯原件可用于實現普通邏輯功能中的數據和控制路徑，而不依賴于馮？諾伊曼結構。它們也能夠利用分布式片上存儲器，以及深度利用流水線并行，這與前饋性深度學習方法自然契合。現代FPGA還支持部分動態重新配置，當FPGA的一部分被重新配置時另一部分仍可使用。這將對大規模深度學習模式產生影響，FPGA 的各層可進行重新配置，而不擾亂其他層正在進行的計算。這將可用于無法由單個FPGA容納的模型，同時還可通過將中間結果保存在本地存儲以降低高昂的全球存儲讀取費用。

　　最重要的是，相比于GPU，FPGA為硬件加速設計的探索提供了另一個視角。GPU和其它固定架構的設計是遵循軟件執行模型，并圍繞自主計算單元并行以執行任務搭建結構。由此，為深度學習技術開發GPU的目標就是使算法適應這一模型，讓計算并行完成、確保數據相互依賴。與此相反，FPGA架構是為應用程序專門定制的。在開發FPGA的深度學習技術時，較少強調使算法適應某固定計算結構，從而留出更多的自由去探索算法層面的優化。需要很多復雜的下層硬件控制操作的技術很難在上層軟件語言中實現，但對FPGA執行卻特別具有吸引力。然而，這種靈活性是以大量編譯（定位和回路）時間為成本的，對于需要通過設計循環快速迭代的研究人員來說這往往會是個問題。

　　除了編譯時間外，吸引偏好上層編程語言的研究人員和應用科學家來開發FPGA的問題尤為艱難。雖然能流利使用一種軟件語言常常意味著可以輕松地學習另一種軟件語言，但對于硬件語言翻譯技能來說卻非如此。針對FPGA 最常用的語言是Verilog和VHDL，兩者均為硬件描述語言（HDL）。這些語言和傳統的軟件語言之間的主要區別是，HDL只是單純描述硬件，而例如 C語言等軟件語言則描述順序指令，并無需了解硬件層面的執行細節。有效地描述硬件需要對數字化設計和電路的專業知識，盡管一些下層的實現決定可以留給自動合成工具去實現，但往往無法達到高效的設計。因此，研究人員和應用科學家傾向于選擇軟件設計，因其已經非常成熟，擁有大量抽象和便利的分類來提高程序員的效率。這些趨勢使得FPGA領域目前更加青睞高度抽象化的設計工具。

　　FPGA深度學習研究里程碑：

　　1987VHDL成為IEEE標準

　　1992GANGLION成為首個FPGA神經網絡硬件實現項目（Cox et al.）

　　1994Synopsys推出第一代FPGA行為綜合方案

　　1996VIP成為首個FPGA的CNN實現方案（Cloutier et al.）

　　2005FPGA市場價值接近20億美元

　　2006首次利用BP算法在FPGA上實現5 GOPS的處理能力

　　2011Altera推出OpenCL，支持FPGA

　　出現大規模的基于FPGA的CNN算法研究（Farabet et al.）

　　2016在微軟Catapult項目的基礎上，出現基于FPGA的數據中心CNN算法加速（Ovtcharov et al.）

　　未來展望

　　深度學習的未來不管是就FPGA還是總體而言，主要取決于可擴展性。要讓這些技術成功解決未來的問題，必須要拓展到能夠支持飛速增長的數據規模和架構。 FPGA技術正在適應這一趨勢，而硬件正朝著更大內存、更少的特征點數量、更好的互連性發展，來適應FPGA多重配置。英特爾收購了Altera，IBM 與Xilinx合作，都昭示著FPGA領域的變革，未來也可能很快看到FPGA與個人應用和數據中心應用的整合。另外，算法設計工具可能朝著進一步抽象化和體驗軟件化的方向發展，從而吸引更廣技術范圍的用戶。

　　常用深度學習軟件工具

　　在深度學習最常用的軟件工具中，有些工具已經在支持CUDA的同時，認識到支持OpenCL的必要性。這將使得FPGA更容易實現深度學習的目的。雖然據我們所知，目前沒有任何深度學習工具明確表示支持FPGA，不過下面的表格列出了哪些工具正朝支持OpenCL方向發展：

　　Caffe，由伯克利視覺與學習中心開發，其GreenTea項目對OpenCL提供非正式支持。Caffe另有支持OpenCL的AMD版本。

　　Torch，基于Lua語言的科學計算框架，使用范圍廣，其項目CLTorch對OpenCL提供非正式支持。

　　Theano，由蒙特利爾大學開發，其正在研發的gpuarray后端對OpenCL提供非正式支持。

　　DeepCL，由Hugh Perkins開發的OpenCL庫，用于訓練卷積神經網絡。

　　對于剛進入此領域、希望選擇工具的人來說，我們的建議是從Caffe開始，因為它十分常用，支持性好，用戶界面簡單。利用Caffe的model zoo庫，也很容易用預先訓練好的模型進行試驗。

　　增加訓練自由度

　　有人或許以為訓練機器學習算法的過程是完全自動的，實際上有一些超參數需要調整。對于深度學習尤為如此，模型在參數量上的復雜程度經常伴隨著大量可能的超參數組合。可以調整的超參數包括訓練迭代次數、學習速率、批梯度尺寸、隱藏單元數和層數等等。調整這些參數，等于在所有可能的模型中，挑選最適用于某個問題的模型。傳統做法中，超參數的設置要么依照經驗，要么根據系統網格搜索或更有效的隨機搜索來進行。最近研究者轉向了適應性的方法，用超參數調整的嘗試結果為配置依據。其中，貝葉斯優化是最常用的方法。

　　不管用何種方法調整超參數，目前利用固定架構的訓練流程在某種程度上局限了模型的可能性，也就是說，我們或許只在所有的解決方案中管窺了一部分。固定架構讓模型內的超參數設置探究變得很容易（比如，隱藏單元數、層數等），但去探索不同模型間的參數設置變得很難（比如，模型類別的不同），因為如果要就一個并不簡單符合某個固定架構的模型來進行訓練，就可能要花很長時間。相反，FPGA靈活的架構，可能更適合上述優化類型，因為用FPGA能編寫一個完全不同的硬件架構并在運行時加速。

　　低耗能計算節點集群

　　深度學習模型最讓人著迷的就是其拓展能力。不管是為了從數據中發現復雜的高層特征，還是為數據中心應用提升性能，深度學習技術經常在多節點計算基礎架構間進行拓展。目前的解決方案使用具備Infiniband互連技術的GPU集群和MPI，從而實現上層的并行計算能力和節點間數據的快速傳輸。然而，當大規模應用的負載越來越各不相同，使用FPGA可能會是更優的方法。FPGA的可編程行允許系統根據應用和負載進行重新配置，同時FPGA的能耗比高，有助于下一代數據中心降低成本。

　　結語

　　相比GPU和GPP，FPGA在滿足深度學習的硬件需求上提供了具有吸引力的替代方案。憑借流水線并行計算的能力和高效的能耗，FPGA將在一般的深度學習應用中展現GPU和GPP所沒有的獨特優勢。同時，算法設計工具日漸成熟，如今將FPGA集成到常用的深度學習框架已成為可能。未來，FPGA將有效地適應深度學習的發展趨勢，從架構上確保相關應用和研究能夠自由實現。

閱讀全文

FPGA(591963) FPGA(591963)
電源管理(141033) 電源管理(141033)
gpu(126252) gpu(126252)

FPGA比CPU和GPU快的原理是什么

本文首先闡述了FPGA的原理了，其次分析了FPGA比CPU和GPU快的原理，最后闡述了CPU與GPU的區別。

2018-05-31 09:00:29

15956

GPU和FPGA優缺點的對比詳細概述你現在要開始了解FPGA了

談談GPU與FPGA的一些看法

2018-06-10 11:44:44

41682

工程師分享：基于FPGA的GPU原型優化設計

Synopsys所做的第一步是啟動一個概念驗證項目。這個項目為Imagination的PowerVR Series6 GPU展示了基于FPGA的原型設計。

2015-06-24 09:47:00

1619

FPGA真的能取代CPU和GPU嗎？

最近我們看到一篇文章，說FPGA可能會取代CPU和GPU成為將來機器人研發領域的主要芯片。文章列舉了很多表格和實驗數據，證明了在很多領域FPGA的性能會極大優于CPU。并且預言FPGA將來可能會取代CPU和GPU現在的地位。但事實真的是這樣嗎？

2016-05-16 10:39:59

16447

相比GPU和GPP，FPGA是深度學習的未來？

相比GPU和GPP，FPGA在滿足深度學習的硬件需求上提供了具有吸引力的替代方案。憑借流水線并行計算的能力和高效的能耗，FPGA將在一般的深度學習應用中展現GPU和GPP所沒有的獨特優勢。同時，算法

2016-07-28 12:16:38

7349

自動駕駛主流架構方案對比：GPU、FPGA、ASIC

當前主流的AI芯片主要分為三類，GPU、FPGA、ASIC。GPU、FPGA均是前期較為成熟的芯片架構，屬于通用型芯片。ASIC屬于為AI特定場景定制的芯片。行業內已經確認CPU不適用于AI計算，但是在AI應用領域也是必不可少。

2023-02-14 11:03:56

2495

相比CPU、GPU、ASIC，FPGA有什么優勢

CPU、GPU 都屬于馮·諾依曼結構，指令譯碼執行、共享內存。FPGA 之所以比 CPU 甚至 GPU 能效高，本質上是無指令、無需共享內存的體系結構帶來的福利。

2022-11-22 16:00:05

1256

ChatGPT炒熱GPU，ASIC和FPGA能否分一杯羹？

算力有著不小需求的應用來說，ASIC和FPGA是否也能借上這股東風呢？ ? 不同硬件的成本對比 ? 在機器學習推理場景中，除了GPU外，還有一大通用AI硬件適合這一負載，那就是FPGA。與GPU一樣，在技術和算法還未成熟且仍在打磨階段時，可以隨時重新編程改變芯片功能的

2023-02-22 09:23:29

5570

3GPP協議中哪些是手機的測試文檔

現在在了解一些有關3GPP測試的文檔，但是3GPP的內容很多，一下子抓不住重點來看.我想看一些有關手機測試的3GPP文檔,該看哪些文檔？請大家指教謝謝

2011-11-21 14:41:33

3GPP協議中文版

3GPP協議中文版.

2012-08-01 23:45:06

3GPP的概念是什么？

3GPP的目標是實現由2G網絡到3G網絡的平滑過渡，保證未來技術的后向兼容性，支持輕松建網及系統間的漫游和兼容性。

2019-09-20 09:10:03

FPGA 超越 GPU，問鼎下一代深度學習主引擎

在下一代 DNN 的性能上擊敗 GPU ？Intel 對兩代 FPGA（Intel Arria 10和 Intel Stratix 10）以及最新的 Titan X GPU 的各種新興DNN的評估顯示

2017-04-27 14:10:12

FPGA2[一天看5個知識]

FPGA2[一天看5個知識]

2012-08-20 22:48:01

FPGA為什么快？

CPU和GPU都屬于馮·諾依曼結構，指令譯碼執行，共享內存。FPGA之所以比CPU、GPU更快，本質上是因為其無指令，無共享內存的體系結構所決定的。馮氏結構中，由于執行單元可能執行任意指令，就需要

2018-08-16 09:54:23

FPGA和CPU、GPU有什么區別？為什么越來越重要？

，在數據中心高性能計算及 AI 訓練中，CPU 這一“主角”的重要性下降，而以往的“配角們”，即 GPU、FPGA、TPU、DPU 等的加速器的重要性在上升。圖3：MLP網絡本質是并行的乘法和累加

2023-11-09 14:09:46

FPGA在深度學習應用中或將取代GPU

現場可編程門陣列 (FPGA) 解決了 GPU 在運行深度學習模型時面臨的許多問題在過去的十年里，人工智能的再一次興起使顯卡行業受益匪淺。英偉達 (Nvidia) 和 AMD 等公司的股價也大幅

2024-03-21 15:19:45

GPU

GPU，Graphic Processing Unit，圖形處理器。GPU是相對于CPU的一個概念，由于在現代的計算機中（特別是家用系統，游戲的發燒友）圖形的處理變得越來越重要，需要一個專門的圖形

2016-01-16 08:59:11

GPU architecture

上學的時候課本里都是CPU，沒有GPU的。現在當做一個業余愛好。有興趣的可以看看。GPU架構

2015-02-13 10:16:47

GPU100HF120D1SE

GPU100HF120D1SE

2023-03-29 17:17:40

GPU150HF120D1SE

GPU150HF120D1SE

2023-03-29 17:17:40

GPU150HF120D2

GPU150HF120D2

2023-03-28 18:08:25

GPU300HF120D2

GPU300HF120D2

2023-03-29 17:17:40

GPU450HF120D2SE

GPU450HF120D2SE

2023-03-28 18:08:25

GPU和CPU的區別是什么

GPU是如何工作的GPU與DSP區別GPU和CPU的區別是什么

2021-01-05 06:15:15

ARM架構的GPU和臺式機的GPU有什么區別

1：移動GPU（指的是ARM處理器集成的GPU）和獨立的PC的GPU的區別？除了架構，就拿視頻解碼來說，為什么ARM的處理器的GPU可以實現硬件解碼4K分辨率的視頻，或者試吃4K的顯示分辨率。而英偉

2020-07-18 08:04:38

CPU和GPU擅長和不擅長的地方

和不擅長”。芯片的速度主要取決于三個方面：微架構、主頻、IPC(每個時鐘周期執行的指令數)。 1．微架構從微架構上看，CPU和GPU看起來完全不是按照相同的設計思路設計的，當代CPU的微架構是按照兼顧

2017-12-03 15:43:58

CPU和GPU擅長和不擅長的地方

和不擅長”。芯片的速度主要取決于三個方面：微架構、主頻、IPC(每個時鐘周期執行的指令數)。1．微架構從微架構上看，CPU和GPU看起來完全不是按照相同的設計思路設計的，當代CPU的微架構是按照兼顧“指令

2017-12-03 20:08:47

MCU、DSP、GPU、MPU、CPU、DPU、FPGA、ASIC、SOC、ECU、NPU、TPU、VPU、APU、BPU、ECU、FPU、EPU、這些主控異同點有哪些？

MCU、DSP、GPU、MPU、CPU、DPU、FPGA、ASIC、SOC、ECU、NPU、TPU、VPU、APU、BPU、ECU、FPU、EPU、這些主控異同點有哪些？

2021-12-17 17:07:47

RT9198A-4GPU5R

RT9198A-4GPU5R - 300mA, Low Noise, Ultra-Fast CMOS LDO Regulator - Richtek Technology Corporation

2022-11-04 17:22:44

Spartan 6 GPU時鐘無法檢查

你好，我從2048x1536分辨率的GPU獲得輸入。我的gpu時鐘是219 MHZ。從gpu探測時鐘我看到了無噪聲時鐘信號但是從斯巴達6 FPGA我觀察到時鐘噪聲。因為這個噪音我無法檢查gpu像素數恰好是2048。所以在FPGA中使用無噪聲時鐘信號的任何解決方案都是為了找到像素數

2019-08-07 10:24:35

VMware GPU分配/在GPU 1之前首先使用GPU 0

嗨，我在ESX 6中使用GRID K2。Atm有像GPU0和GPU1之間的負載平衡。如果我在主機上打開2 K240q，則第一個VM被分配給GPU0，即第二個GPU1。我無法啟動此主機上的任何

2018-09-10 17:14:36

XS GPU是什么？XS GPU的主要特性包括哪些？

請問一下XS GPU是什么？XS GPU的主要特性包括哪些？XS GPU具備哪些功能？主要應用于哪些領域？

2021-07-01 06:55:05

Xilinx收購Auviz Systems，FPGA與GPU之戰終于要開始了

、機器學習、視覺算法等，為行業提供基于FPGA的中間件IP，以減少應用程序的功耗。FPGA可作為類似GPU一樣的加速技術被整合在處理器產品當中，與傳統的芯片不同，FPGA芯片出廠后，客戶可根據不同場景

2016-09-08 13:54:13

ai芯片和gpu的區別

ai芯片和gpu的區別▌車載芯片的發展趨勢(CPU-GPU-FPGA-ASIC)過去汽車電子芯片以與傳感器一一對應的電子控制單元(ECU)為主，主要分布與發動機等核心部件上。...

2021-07-27 07:29:46

?GPU，RISC-V的長痛

完成IMG BXE-2-32 GPU與其AX45 RISC-V GPU的聯合驗證工作，在FPGA上使用Linux系統完成了渲染大量圖形的工作負載和基準測試。而此前RIOS Labs的RISC-V

2022-03-24 15:53:12

【詳解】FPGA：深度學習的未來？

越來越各不相同，使用FPGA可能會是更優的方法。FPGA的可編程行允許系統根據應用和負載進行重新配置，同時FPGA的能耗比高，有助于下一代數據中心降低成本。5. 結語相比GPU和GPP，FPGA在滿足深度

2018-08-13 09:33:30

專業工程師分享FPGA設計中的功率計算技巧速看

專業工程師分享FPGA設計中的功率計算技巧速看

2021-05-07 06:16:20

為什么說FPGA并不會取代CPU和GPU成為機器人開發的新寵兒？

最近我們看到一篇文章，說FPGA可能會取代CPU和GPU成為將來機器人研發領域的主要芯片。文章列舉了很多表格和實驗數據，證明了在很多領域FPGA的性能會極大優于CPU。并且預言FPGA將來可能會取代

2019-10-09 08:33:52

為什么需要FPGA，如何為FPGA編程？

本文通過與GPU對比，來搞懂FPGA的一些難點，解答幾個有關FPGA的常見問題——什么是FPGA、為什么我會需要FPGA、如何為FPGA編程？FPGA（現場可編程門陣列）是集成電路中的重要門類

2020-10-29 07:27:37

人工智能到底用 GPU？還是用 FPGA？

GPU 和 FPGA。有人說 GPU 好用；有人說 FPGA 靈活可編程；有人說 GPU 運算能力強，適合對人工智能進行“訓練”；有人說做“推斷”還得靠 FPGA … 作為程序員，您會更傾向于用哪一種方案？`

2017-08-23 15:42:16

什么電源管理適用于FPGA、GPU和ASIC系統

在 FPGA、GPU 或 ASIC 控制的系統板上，僅有為數不多的幾種電源管理相關的設計挑戰，但是由于需要反復調試，所以這類挑戰可能使系統的推出時間嚴重滯后。

2019-10-09 06:21:11

什么電源管理適用于FPGA、GPU和ASIC系統？

2019-09-30 06:59:24

大家好，咨詢下，GPU配置，VRAM是做什么的？

看AM335X GPU資料，要設置setenv bootargs 'console=ttyO0,115200n8 root=/dev/nfs nfsroot=:,nolock rw mem=256M

2018-05-15 02:17:24

如何實現3GPP毫微微蜂窩測試？

如何評估3GPP家庭節點B的性能？3GPP毫微微蜂窩技術是什么？毫微微蜂窩基站部署的重要組件有哪些？如何實現3GPP毫微微蜂窩測試？

2021-04-15 06:30:57

對FPGA與ASIC/GPU NN實現進行定性的比較

實現極高的效率和特定算法的集成化，但是不具備靈活性，可以支持的算法范圍較少。而FPGA介于GPU和ASIC之間。FPGA不會在實現神經網絡的所有指標上都“擊敗”GPU和ASIC，但在某些方面，FPGA

2023-02-08 15:26:46

怎么看FPGA管腳定義

現在設計FPGA電路，想用EP4CE40F484，可是數據手冊里沒有A1、B2······這些管腳的定義，想請問一下FPGA管腳定義改怎么看啊？

2018-03-29 10:53:04

用于加速c代碼的PCIe FPGA如何開始

嗨，我將從一個新項目開始。它涉及使用FPGA和GP / GPU加速PCIe板，這些板將被添加到常規計算機或服務器中。 GPU將是NVIDIA特斯拉。 FPGA板......還有待選擇。我確實看到了

2019-01-24 10:55:48

請教如何同時調試DSPLink的GPP和DSP端程序

1.在Ubuntu下編輯和編譯DSPLink的GPP和DSP端程序。 2.在目標板上執行程序，GPP端程序可以通過printf來顯示日志信息，但是DSP不知道如何顯示日志信息。 3.在網上查找，一種

2018-06-21 20:16:33

請問CPU和GPU的關系是什么？

什么是顯卡？什么是GPU？什么是CUDA？CPU和GPU的關系是什么？

2021-09-27 08:22:16

請問imx6q如何查看gpu實時使用率？

做圖像處理的應用，想實時看下gpu的使用情況，改如何操作呢？目前試過cat /sys/kernel/debug/clk/clk_summary | grep gpu但看不出使用了多少。有沒有類似top命令那樣可以看GPU？

2022-01-07 07:50:52

適用于FPGA、GPU和ASIC系統的電源管理

　　在 FPGA、GPU 或 ASIC 控制的系統板上，僅有為數不多的幾種電源管理相關的設計挑戰，但是由于需要反復調試，所以這類挑戰可能使系統的推出時間嚴重滯后。不過，如果特定設計或類似設計已經得到

2018-10-15 10:30:31

適用于FPGA、GPU和ASIC系統的電源管理

　　在 FPGA、GPU 或 ASIC控制的系統板上，僅有為數不多的幾種電源管理相關的設計挑戰，但是由于需要反復調試，所以這類挑戰可能使系統的推出時間嚴重滯后。不過，如果特定設計或類似設計已經得到

2018-11-20 10:46:52

220.GPU相關視頻

gpu

小凡發布于 2022-10-04 13:04:48

263.什么是GPU

gpu

小凡發布于 2022-10-04 14:14:08

什么是3GPP？

什么是3GPP？第三代合作伙伴計劃(3rd Generation Partnership Project，即3GPP)是一個成立于1998年12月的標準化機構。目前其成員包括歐洲的ETSI、日本的A

2010-03-13 16:26:58

2729

3GPP and ETSI

3GPP and ETSI Security Standards

2016-06-06 10:29:29

適用于 FPGA、GPU 和 ASIC 系統的電源管理

在 FPGA、GPU 或 ASIC 控制的系統板上，僅有為數不多的幾種電源管理相關的設計挑戰，但是由于需要反復調試，所以這類挑戰可能使系統的推出時間嚴重滯后。不過，如果特定設計或類似設計已經得到電源

2016-11-04 15:57:06

610

FPGA替代GPU有哪些問題？6大顧慮讓你解惑

最近FPGA又頻頻被各AI領域的巨頭看好，比如微軟、百度、科大訊飛都對FPGA應用前景有所期待。那么如果讓你選擇FPGA作為AI計算系統的主力軍，你會有什么樣的顧慮? 這幾天，已經退役

2018-01-26 11:59:00

1294

FPGA為什么比CPU和GPU快

FPGA仿真篇-使用腳本命令來加速仿真二基于FPGA的HDMI高清顯示借口驅動基于FPGA灰度圖像高斯濾波算法的實現 FPGA為什么比CPU和GPU快基于Xilinx FPGA的視頻圖像采集

2018-02-20 20:49:00

1478

深度學習方案ASIC、FPGA、GPU比較哪種更有潛力

幾乎所有深度學習的研究者都在使用GPU，但是對比深度學習硬鑒方案，ASIC、FPGA、GPU三種究竟哪款更被看好？主要是認清對深度學習硬件平臺的要求。

2018-02-02 15:21:40

10202

FPGA比CPU和GPU快的原因

CPU和GPU都屬于馮·諾依曼結構，指令譯碼執行，共享內存。FPGA之所以比CPU、GPU更快，本質上是因為其無指令，無共享內存的體系結構所決定的。

2018-04-02 17:52:31

95602

什么是ASIC芯片？與CPU、GPU、FPGA相比如何？

不過在聯發科副總經理暨智能設備事業群總經理游人杰看來，雖然CPU、GPU等通用型芯片以及FPGA可以適應相對更多種的算法，但是特定算法下ASIC的性能和效能要更高。另外，雖然FPGA的便定制特性比ASIC芯片更加靈活，但部署FPGA所付出的成本也要比ASIC更高。

2018-05-04 15:39:03

251868

為什么使用FPGA？FPGA為什么比GPU的延遲低這么多？

基本相當，而比 GPU 低一個數量級。我們即將用上的下一代 FPGA，Stratix 10，將配備更多的乘法器和硬件浮點運算部件，從而理論上可達到與現在的頂級 GPU 計算卡旗鼓相當的計算能力。

2018-06-25 16:02:45

17458

介紹GPU與FPGA的幾個方面和看法

除了芯片性能外，GPU相對于FPGA還有一個優勢就是內存接口。GPU的內存接口（傳統的GDDR，最近更是用上了HBM和HBM2）的帶寬遠好于FPGA的傳統DDR接口，而眾所周知服務器端機器學習算法需要頻繁訪問內存。

2018-09-15 09:15:00

838

相較于GPU只能處理運算 FPGA能更快速的處理所有與AI相關資訊

NVIDIA 雖憑借通用GPU（GPGPU）登上人工智慧（AI）芯片一哥位置，但競爭對手早已在一旁虎視眈眈。美國低功耗現場可程式邏輯閘陣列（FPGA）制造商Xilinx 表示，伙伴廠商利用FPGA

2019-01-18 14:14:42

499

在多個應用場合擊敗ASIC后現在FPGA廠商又開始瞄向了DSP陣營

經過20多年的努力后，在工藝技術進步和市場需求的推動下，“大器晚成”的FPGA終于從外圍邏輯應用進入到信號處理系統核心。在多個應用場合擊敗ASIC后，現在FPGA廠商又開始將目光瞄向了一向是親密戰友的DSP陣營。

2019-02-19 14:41:55

1060

淺析GPU、FPGA、ASIC三種主流AI芯片的區別

當前主流的AI芯片主要分為三類，GPU、FPGA、ASIC。其中GPU、FPGA均是前期較為成熟的芯片架構，屬于通用型芯片。ASIC屬于為AI特定場景定制的芯片。

2019-03-07 14:39:21

29058

芯片領域兩大主角 FPGA和GPU

電子元器件大家接觸的會比較多，這一塊民用、軍用的技術基本都是通用的，但在芯片這個領域有兩種比較獨特的芯片，一種叫FPGA，就是我剛才講的那種，還有一個叫GPU。

2019-08-13 14:41:24

1084

萬能的FPGA真的能取代CPU和GPU嗎

FPGA相對于CPU和GPU，在進行感知處理等簡單重復的任務的時候的優勢很明顯，按照現在的趨勢發展下去，FPGA或許會在未來取代機器人開發中GPU的工作。

2019-09-06 17:48:10

2115

GPU和GPP相比誰才是深度學習的未來

相比GPU和GPP，FPGA在滿足深度學習的硬件需求上提供了具有吸引力的替代方案。憑借流水線并行計算的能力和高效的能耗，FPGA將在一般的深度學習應用中展現GPU和GPP所沒有的獨特優勢。

2019-10-18 15:48:14

1326

FPGA有著優于傳統GPP加速能力的顯著潛力

作為GPU在算法加速上強有力的競爭者，FPGA是否立即支持不同硬件，顯得尤為重要。FPGA與GPU不同之處在于硬件配置靈活，且FPGA在運行深入學習中關鍵的子程序（例如對滑動窗口的計算）時，單位能耗下通常能比GPU提供更好的表現。

2019-10-18 15:42:04

626

FPGA相比GPU和CPU有什么行業競爭優勢

與其他計算載體如CPU與GPU相比，FPGA具有高性能、低能耗以及可硬件編程的特點。圖1介紹了FPGA的硬件架構，每個FPGA主要由叁個部分組成：輸入輸出邏輯，主要用于FPGA與外部其他部件，比如傳感器的通信。

2019-10-21 14:56:17

2474

FPGA有什么優勢，可以讓FPGA替代GPU嗎

目前，在AI計算平臺使用最廣泛的兩種加速部件是GPU和FPGA。GPU可適用于具備計算密集、高并行、SIMD（SingleInstructionMultipleData，單指令多數據流）應用等特點

2019-11-01 15:07:07

2655

FPGA相對于CPU和GPU而言有著比較明顯的優勢

2019-12-20 14:39:31

2425

NVIDIA總監：GPU在可編程比FPGA有優勢

上周，在GTC19大會期間，NVIDIA加速計算產品管理總監Paresh Kharya對關于GPU相比FPGA的優勢的問題時回答表示，GPU在可編程上具備明顯優勢，整個開發時間更短。

2019-12-27 14:47:33

2760

FPGA取代AI加速器中的GPU

AI軟件初創公司Mipsology正在與Xilinx合作，以使FPGA能夠僅使用一個附加命令即可替換AI加速器應用程序中的GPU。Mipsology的“零努力”軟件Zebra將GPU代碼轉換為可在

2020-07-21 15:14:05

9140

FPGA與GPU架構的背景

FPGA 可提供一種不同的 AI 優化的硬件方法。與 GPU 不同，FPGA 提供獨特的精細化空間可重構性。這意味著我們可以配置 FPGA 資源，以極為準確的順序執行精確的數學函數，從而實施所需的操作。

2022-06-13 09:58:35

1059

頂級FPGA和GPU的PK

首先，文章使用GPU最擅長處理的工作負載：通用矩陣乘(GEMM)來跑GPU的benchmark(什么是GEMM請移步https://spatial-lang.org/gemm)，為了測量最佳的GPU

2022-08-16 09:22:09

2277

FPGA和GPU的特點及如何堆疊幫助系統集成商

　　當今的嵌入式系統設計人員有各種各樣的處理器類型可供選擇，與更熟悉的CPU（中央處理器）相比，FPGA（現場可編程門陣列）和GPU（圖形處理單元）增加了自己的各種優點和缺點。了解這些特性以及

2022-11-15 15:51:33

767

FPGA與CPU、GPU、ASIC的區別，FPGA在云計算中的應用方案

陌生，它一直都被廣泛使用。但是，大部分人還不是太了解它，對它有很多疑問——FPGA到底是什么？為什么要使用它？相比 CPU、GPU、ASIC（專用芯片），FPGA有什么特點？…… 今天，帶著這一系列的問題，我們一起來——揭秘FPGA。一、為什么使用 FPGA？眾所周知，

2022-11-22 14:35:10

1087