每種類型的邊緣 AI 都有三個硬性和快速的技術(shù)要求:低功耗、小尺寸和高性能。當(dāng)然,“小型”、“節(jié)能”或“高性能”的構(gòu)成因用例而異,可以描述從小型微控制器到邊緣服務(wù)器的所有內(nèi)容,但通常您必須至少犧牲一個才能獲得其他。
但是,一種可以解決從邊緣云到端點(diǎn)的所有問題而無需犧牲的解決方案是 FPGA。
幾十年來,F(xiàn)PGA 一直用于提供低功耗、高性能的設(shè)計靈活性,無論應(yīng)用程序或外形尺寸如何,但它們并不完全是用戶友好的——復(fù)雜的 AI 模型和算法的不斷發(fā)展加劇了這一事實(shí)。然而,在有挑戰(zhàn)的地方通常也有機(jī)會,對于工業(yè)自動化、智慧城市、交通、醫(yī)療保健、農(nóng)業(yè)和其他市場中的邊緣人工智能用例,以及其他快速采用計算機(jī)視覺等功能的市場,機(jī)會以FlexLogix X1M 人工智能加速器。
Flex Logix X1M AI 加速器針對實(shí)時、高分辨率計算機(jī)視覺用例,這些用例運(yùn)行基于 Yolov3、Yolov4 和 Yolov5 等模型的小批量深度學(xué)習(xí)工作負(fù)載。為了以比 NVIDIA Tesla T4、Xavier NX 或 Jetson TX2 等設(shè)備更高的每美元吞吐量提供視覺邊緣推理,新的 X1M M.2 模塊利用 Flex Logix 的 InferX X1 架構(gòu),將 4K INT8 MAC 內(nèi)核組合成 64 個8 MB SRAM 和 4 GB 16 MTps LPDDR4X DRAM 支持 x 64 張量處理器陣列。
鑒于板載內(nèi)存,X1M AI 加速器本身支持 PCI Express Gen 3 或 4 的 x2 通道作為主機(jī)總線協(xié)議。PCIe 支持不僅促進(jìn)了張量陣列與內(nèi)存和存儲中的數(shù)據(jù)或模型之間的高速數(shù)據(jù)傳輸,還能夠符合 M.2 2280 B+M 關(guān)鍵外形規(guī)格規(guī)格,尺寸為 22 mm (W) x 80 毫米(長)x 17 毫米深(包括散熱器)。
X1M AI 加速器的大小與口香糖差不多,消耗的功率也比時鐘收音機(jī)多一點(diǎn),它真正占據(jù)了技術(shù)功率-性能尺寸維恩圖的中心。
InferX X1M 邊緣推理加速器正在運(yùn)行
該平臺的張量陣列使其能夠處理具有數(shù)百層、數(shù)十個并行通道和多種算子類型的深度神經(jīng)網(wǎng)絡(luò),與 GPU 不同,它可以應(yīng)用于批量小至 1 的百萬像素圖像。
盡管展示了 ASIC 的性能特征,但 InferX X1M 擁有 FPGA 獨(dú)有的能力。其中包括可重新配置的數(shù)據(jù)路徑,允許設(shè)備硬件適應(yīng)新的和不同的模型技術(shù),即使在現(xiàn)場部署之后也是如此。從本質(zhì)上講,這使這些設(shè)備能夠面向未來。
重要的是,用戶無需了解硬件開發(fā)語言或手動重新編程 FPGA 比特流即可訪問這些功能以及控制邏輯等其他功能。這要?dú)w功于為用戶提供對低級平臺控制功能和監(jiān)控功能的內(nèi)部訪問以及可用于應(yīng)用程序配置或模型部署的外部訪問的 API。
此外,開放神經(jīng)網(wǎng)絡(luò)交換 (ONNX) 格式的兼容性允許 InferX X1M 工具以最佳方式自動將框架中表示的任何模型映射到 X1 加速器。
該解決方案支持在 Windows 和 Linux 操作環(huán)境中進(jìn)行開發(fā)。
Flex Logix InferX X1M 加速器入門
除了上面列出的好處之外,InferX X1M 加速器的最大優(yōu)勢可能在于它使邊緣 AI 和計算機(jī)視覺 OEM 和系統(tǒng)集成商不必設(shè)計自己的定制板。這些 M.2 模塊設(shè)計用于在 0oC 至 50oC 的溫度范圍和 10% 至 90% 的相對非冷凝濕度范圍內(nèi)可靠地運(yùn)行,所有這些都具有競爭力的成本。
審核編輯:郭婷
-
asic
+關(guān)注
關(guān)注
34文章
1199瀏覽量
120441 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4771瀏覽量
100720 -
AI
+關(guān)注
關(guān)注
87文章
30763瀏覽量
268906
發(fā)布評論請先 登錄
相關(guān)推薦
評論