色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

在賽靈思FPGA SoC平臺上使用VITIS AI加速人工智能應用

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Vaibhav Kothari ? 2022-11-22 14:48 ? 次閱讀

VITIS 是一個用于開發軟件和硬件的統一軟件平臺,將 Vivado 和其他組件用于 Xilinx FPGA SoC 平臺,如 ZynqMP UltraScale+ 和 Alveo 卡。VITIS SDK的關鍵組件,VITIS AI運行時(VART),為在邊緣和云端部署終端ML/AI應用程序提供了一個統一的接口。

機器學習中的推理是計算密集型的,需要高內存帶寬和高性能計算,以滿足各種終端應用的低延遲和高吞吐量需求。

維蒂斯人工智能工作流程

Xilinx Vitis AI 提供了一個工作流程,使用簡單的流程在 Xilinx 深度學習處理單元 (DPU) 上部署深度學習推理應用:

深度處理單元 (DPU) 是一個可配置的計算引擎,針對深度學習推理應用的卷積神經網絡進行了優化,并放置在可編程邏輯 (PL) 中。DPU 包含高效且可擴展的 IP 核,可進行定制以滿足許多不同應用的需求。DPU 定義自己的指令集,Vitis AI 編譯器生成指令。

VITIS AI編譯器以優化的方式安排指令,以獲得最大的效能。

在 Xilinx ZynqMP UltraScale+ SoC 平臺上運行任何 AI 應用程序的典型工作流程包括以下內容:

模型量化

模型編譯

模型優化(可選)

構建 DPU 可執行文件

構建軟件應用程序

集成 VITIS AI 統一 API

編譯和鏈接混合 DPU 應用程序

在 FPGA 上部署混合 DPU 可執行文件

人工智能量化器

AI 量化器是一種用于量化過程的壓縮工具,通過將 32 位浮點權重和激活轉換為定點 INT8。它可以在不丟失模型準確信息的情況下降低計算復雜性。定點模型需要更少的內存,因此提供比浮點實現更快的執行速度和更高的電源效率。

人工智能編譯器

AI 編譯器將網絡模型映射到高效的指令集和數據流。編譯器的輸入是量化的 8 位神經網絡,輸出是 DPU 內核 - 可執行文件將在 DPU 上運行。在這里,不支持的層需要部署在CPU中,或者可以自定義模型來替換和刪除那些不支持的操作。它還執行復雜的優化,如層融合、指令調度和片上存儲器的重用。

一旦我們能夠執行 DPU,我們需要使用 Vitis AI 統一的 API 來初始化數據結構,初始化 DPU,在 CPU 上實現 DPU 不支持的層,并根據需要在 PL/PS 上添加預處理和后處理。

人工智能優化器

憑借其模型壓縮技術,AI 優化器可以將模型復雜性降低 5-50 倍,同時對準確性的影響最小。這種深度壓縮將推理性能提升到一個新的水平。我們可以實現所需的稀疏性并將運行時間縮短 2.5 倍。

AI 分析器

AI 探查器可以幫助分析推理查找導致端到端管道瓶頸的注意事項。性能分析器為設計人員提供了 DPU/CPU/內存的通用時間線。此過程不會更改任何代碼,并且可以跟蹤函數并進行分析。

人工智能運行時

VITIS AI 運行時 (VART) 允許應用程序使用統一的高級運行時 API 進行邊緣和云部署,使其無縫且高效。一些主要功能包括:

異步作業提交

異步作業收集

C++Python 實現

多線程和多進程執行

Vitis AI還提供DSight,DExplorer,DDump和DLet等,用于各種任務執行。

DSight & DExplorer

DPU IP 為特定內核提供了多種配置,可根據網絡型號進行選擇。DSight 告訴我們每個 DPU 內核的利用率百分比。它還提供了調度程序的效率,以便我們可以調整用戶線程。還可以查看性能數字,例如每層和每個DPU節點的MOPS,運行時和內存帶寬。

Softnautics選擇 Xilinx ZynqMP UltraScale+ 平臺進行高性能和計算部署。它提供最佳的應用處理、高度可配置的 FPGA 加速功能,以及 VITIS SDK,以加速高性能 ML/AI 推理。我們針對的一個這樣的應用是用于 Covid-19 篩查的口罩檢測。其目的是根據各國政府對 Covid-19 預防措施指南的要求,部署多流推理,用于對戴口罩的人進行 Covid-19 篩查并實時識別違規行為。

我們準備了一個數據集并選擇了預先訓練的權重來設計一個用于掩模檢測和篩選的模型。我們通過TensorFlow框架訓練和修剪了我們的自定義模型。這是人臉檢測和面具檢測的兩階段部署。這樣獲得的訓練模型是通過前面章節中介紹的VITIS AI工作流程傳遞的。我們觀察到推理時間的速度是 CPU 的 10 倍。Xilinx 提供不同的調試工具和實用程序,在初始開發和部署過程中非常有用。在初始部署階段,我們沒有檢測到掩碼和非掩碼類別。我們嘗試將基于 PC 的推理輸出與一個名為 Dexplorer 的調試實用程序之一的輸出相匹配。但是,調試模式和根導致問題進一步調試。運行量化器后,我們可以使用更大的校準圖像、迭代和檢測來調整輸出,視頻饋送的準確率約為 96%。我們還嘗試使用 AI 分析器識別管道中的瓶頸,然后采取糾正措施通過各種方式消除瓶頸,例如使用 HLS 加速來計算后處理中的瓶頸。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1629

    文章

    21729

    瀏覽量

    603024
  • soc
    soc
    +關注

    關注

    38

    文章

    4163

    瀏覽量

    218170
  • 人工智能
    +關注

    關注

    1791

    文章

    47206

    瀏覽量

    238276
收藏 人收藏

    評論

    相關推薦

    嵌入式和人工智能究竟是什么關系?

    人工智能的結合,無疑是科技發展中的一場革命。人工智能硬件加速中,嵌入式系統以其獨特的優勢和重要性,發揮著不可或缺的作用。通過深度學習和神經網絡等算法,嵌入式系統能夠高效地處理大量數
    發表于 11-14 16:39

    soc人工智能中的創新應用

    社會計算(Social Computing, SOC)是一個跨學科領域,它結合了社會科學、計算機科學和人工智能,以理解和設計社會互動中的技術系統。隨著人工智能AI)技術的發展,
    的頭像 發表于 11-10 09:30 ?374次閱讀

    AI for Science:人工智能驅動科學創新》第6章人AI與能源科學讀后感

    幸得一好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 閱讀《AI for Science:人工智能驅動科學創新》的第6章后,我深刻感受到人工智
    發表于 10-14 09:27

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    很幸運社區給我一個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅動科學創新》第4章關于AI與生命科學的部分,為我們揭示了人工
    發表于 10-14 09:21

    AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得

    非常高興本周末收到一本新書,也非常感謝平臺提供閱讀機會。 這是一本挺好的書,包裝精美,內容詳實,干活滿滿。 關于《AI for Science:人工智能驅動科學創新》第二章“AI
    發表于 10-14 09:16

    AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得

    周末收到一本新書,非常高興,也非常感謝平臺提供閱讀機會。 這是一本挺好的書,包裝精美,內容詳實,干活滿滿。 《AI for Science:人工智能驅動科學創新》這本書的第一章,作為整個著作的開篇
    發表于 10-14 09:12

    risc-v人工智能圖像處理應用前景分析

    、RISC-V人工智能圖像處理中的應用案例 目前,已有多個案例展示了RISC-V人工智能圖像處理中的應用潛力。例如: Esperanto技術公司 :該公司制造的首款高性能RISC-
    發表于 09-28 11:00

    人工智能ai 數電 模電 模擬集成電路原理 電路分析

    人工智能ai 數電 模電 模擬集成電路原理 電路分析 想問下哪些比較容易學 不過好像都是要學的
    發表于 09-26 15:24

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領域應用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結經驗,擬
    發表于 09-09 15:36

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅動科學創新

    、污染治理、碳減排三個方面介紹了人工智能為環境科學引入的新價值和新機遇。 第8章探討了AI for Science快速發展過程中面臨的機遇和挑戰,并對“平臺科研”模式進行了展望。
    發表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產業博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能
    發表于 08-22 15:00

    FPGA人工智能中的應用有哪些?

    FPGA(現場可編程門陣列)人工智能領域的應用非常廣泛,主要體現在以下幾個方面: 一、深度學習加速 訓練和推理過程加速
    發表于 07-29 17:05

    FPGA flash操作原理

    FPGA flash操作原理分享
    的頭像 發表于 04-09 15:03 ?992次閱讀

    為何高端FPGA都非常重視軟件

    轉化為針對其問題的合理優化的基于FPGA的解決方案的途徑。 作為其Vitis統一軟件平臺聲明的一部分,
    發表于 03-23 16:48

    嵌入式人工智能的就業方向有哪些?

    。 國內外科技巨頭紛紛爭先入局,微軟、谷歌、蘋果、臉書等積極布局人工智能的同時,國內的BAT、華為、小米等科技公司也相繼切入到嵌入式人工智能的賽道。那么嵌入式AI可就業的方向有哪些呢
    發表于 02-26 10:17
    主站蜘蛛池模板: 久久精品一卡二卡三卡四卡视频版| 果冻传媒独家原创在线观看| 国产AV视频二区在线观看| 久久这里只有精品1| 亚洲欧美综合中文| 精品亚洲国产成AV人片传媒| 性色AV一区二区三区V视界影院| xxxxx69hd杨幂| 老师我好爽再深一点老师好涨| 亚洲国产成人精品久久久久| 国产国产成年在线视频区| 人曽交Z00Z0OA片| 国产AV高清怡春院| 网友自拍偷拍| 国产在线观看成人| 亚洲色偷偷偷网站色偷一区人人藻| 丰满少妇69激懒啪啪无码| 深夜释放自己污在线看| 国产精品青青草原app大全| 熟女人妻久久精品AV天堂| 亚洲午夜精品一区二区公牛电影院| 中文字幕亚洲乱码熟女在线| 好紧小嫩嫩水的10p| 一本色道久久88综合日韩精品| 果冻传媒AV精品一区| 午夜神器18以下不能进免费| 疯狂小护士| 色偷偷888欧美精品久久久| 被肉日常np快穿高h| 一天不停的插BB十几次| 久久久97人妻无码精品蜜桃| 国产人妻午夜无码AV天堂| 国产精品日本一区二区在线播放 | 欧美精品AV精品一区视频| 精品久久免费观看| 亚洲裸舞 hd| 精品国产免费第一区二区| 亚洲精品久久久久69影院| 久久精品国产亚洲AV影院| 中文文字幕文字幕亚洲色| 巨大乳hdbbw|