色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Xilinx Zynq系列FPGA實現神經網絡中相關資源評估

FPGA之家 ? 來源:FPGA之家 ? 作者:FPGA之家 ? 2022-04-07 11:31 ? 次閱讀

0Zynq7000系列概覽

94155fe2-b5e8-11ec-aa7f-dac502259ad0.png

1內存占用

1.1 FPGA程序中內存的實現方式

參閱xilinx文檔UG998

942dedb4-b5e8-11ec-aa7f-dac502259ad0.png

FPGA并沒有像軟件那樣用已有的cache,FPGA的HLS編譯器會在FPGA中創建一個快速的memory architecture以最好的適應算法中的數據樣式(data layout)。因此FPGA可以有相互獨立的不同大小的內部存儲空間,例如寄存器,移位寄存器,FIFOs和BRAMs

寄存器:最快的內存結構,集成在在運算單元之中,獲取不需要額外的時延。

移位寄存器:可以被當作一個數據序列,每一個數據可以在不同的運算之中被重復使用。將其中所有數據移動到相鄰的存儲設備中只需要一個時鐘周期。

FIFO:只有一個輸入和輸出的數據序列,通常被用于循環或循環函數,細節會被HLS編譯器處理。

BRAM:集成在FPGA fabric模塊中的RAM,每個xilinx的FPGA中集成有多個這樣的BRAM。可以被當作有以下特性的cache:1.不支持像處理器cache中那樣的緩存一致性(cache coherency,collision),不支持處理器中的一些邏輯類型。2.只在設備有電時保持內存。3.不同的BRAM塊可以同時傳輸數據。

1.2Zynq的BRAM內存大小

94409540-b5e8-11ec-aa7f-dac502259ad0.png

zynq 7z020的BRAM為4.9Mb,7z035的BRAM為17.6Mb(2.2MB)

9451e96c-b5e8-11ec-aa7f-dac502259ad0.png

1.3一個卷積操作占用的內存

例如,我們實現的卷積函數,輸入27×600,卷積核16×27,輸出16×600,數據類型為float。

  //convolution operation

for (i = 0; i < 16; i++) {

    for (j = 0; j < 600; j++) {

      result = 0;

      for (k = 0; k < 27; k++) {

        temp = weights[i*27+k] * buf_in[k*600+j];

        result += temp;

      }

      buf_out[i*600+j] = result;

    }

  }


在HLS中生成的IPcore占用硬件資源為:

94768290-b5e8-11ec-aa7f-dac502259ad0.png

948c8400-b5e8-11ec-aa7f-dac502259ad0.png

9499078e-b5e8-11ec-aa7f-dac502259ad0.png

在vivado中搭建好系統,占用的資源為:

94a95382-b5e8-11ec-aa7f-dac502259ad0.png

94b7ea3c-b5e8-11ec-aa7f-dac502259ad0.png

2PipeCNN可實現性

PipeCNN是一個基于OpenCL的FPGA實現大型卷積網絡的加速器。

PipeCNN解析文檔:

PipeCNN論文解析:用OpenCL實現FPGA上的大型卷積網絡加速

github地址:https://github.com/doonny/PipeCNN#how-to-use

2.1 已實現的PipeCNN資源消耗

對于Altera FPGA,運用Intel's OpenCL SDKv16.1 toolset.

對于Xilinx FPGAs, theSDAcceldevelopment environment v2017.2 can be used.

94c7cd1c-b5e8-11ec-aa7f-dac502259ad0.png

Xilinx'sKCU1500(XCKU115 FPGA)(已經有xilin的板子實現過pipeCNN,但是型號比zynq高很多)

94e36eaa-b5e8-11ec-aa7f-dac502259ad0.png

硬件資源可以被三個宏調控,device/hw_param.cl. Change the following macros

  • VEC_SIZE

  • LANE_NUM

  • CONV_GP_SIZE_X

消耗資源為:

94f89c80-b5e8-11ec-aa7f-dac502259ad0.png

95070432-b5e8-11ec-aa7f-dac502259ad0.png

3實現大型神經網絡的方法

方案一:壓縮模型到<2.2MB,可實現在BRAM中

優點:1.速度快 2.實現方便

缺點:1.模型壓縮難度 2.難以實現大型網絡

方案二:用FPGA調用DDR

優點:1.速度中等 2.可實現大型網絡

缺點:調用DDR有難度,開發周期長

方案三:用片上單片機調用DDR(插入SD卡)分包傳入IPcore運算

優點:可實現大型網絡

缺點:速度較慢

4Virtex-7高端FPGA概覽

Virtex-7為高端FPGA,比Zynq高了一個檔次。

951bc20a-b5e8-11ec-aa7f-dac502259ad0.png

952c0bc4-b5e8-11ec-aa7f-dac502259ad0.png

7系列FPGA相關文檔:

95392c3c-b5e8-11ec-aa7f-dac502259ad0.png

審核編輯 :李倩


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1629

    文章

    21729

    瀏覽量

    603018
  • 寄存器
    +關注

    關注

    31

    文章

    5336

    瀏覽量

    120235
  • 神經網絡
    +關注

    關注

    42

    文章

    4771

    瀏覽量

    100719

原文標題:Xilinx Zynq系列FPGA實現神經網絡中相關資源評估

文章出處:【微信號:zhuyandz,微信公眾號:FPGA之家】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    FPGA程序內存的實現方式

    ? ? Xilinx zynq系列FPGA實現神經網絡評估
    發表于 07-10 09:24 ?1986次閱讀

    脈沖耦合神經網絡FPGA上的實現誰會?

    脈沖耦合神經網絡(PCNN)在FPGA上的實現實現數據分類功能,有報酬。QQ470345140.
    發表于 08-25 09:57

    【PYNQ-Z2申請】基于PYNQ的神經網絡自動駕駛小車

    ,分享項目的開展,實施過程,結果,展示項目結果,并全程開源項目源碼。本人一直非常希望學習與實踐Xilinx Zynq系列FPGA芯片與基于FPGA
    發表于 12-19 11:36

    【PYNQ-Z2試用體驗】基于PYNQ的神經網絡自動駕駛小車 - 項目規劃

    小車運動的控制信號,實現小車自動駕駛。在初步實現方案,為了快速實現整體功能,使用軟件神經網絡作為控制器,使用單片機作為底盤電機的控制器。在
    發表于 03-02 23:10

    基于賽靈思FPGA的卷積神經網絡實現設計

    FPGA實現卷積神經網絡 (CNN)。CNN 是一類深度神經網絡,在處理大規模圖像識別任務以及與機器學習類似的其他問題方面已大獲成功。在當前案例
    發表于 06-19 07:24

    如何設計BP神經網絡圖像壓縮算法?

    (Digital Signal Processor)相比,現場可編程門陣列(Field Programma-ble Gate Array,FPGA)在神經網絡實現上更具優勢。DSP處理器在處理時采用指令順序執行
    發表于 08-08 06:11

    如何移植一個CNN神經網絡FPGA

    )第二步:使用Lattice sensAI 軟件編譯已訓練好的神經網絡,定點化網絡參數。該軟件會根據神經網絡結構和預設的FPGA資源進行分析
    發表于 11-26 07:46

    基于FPGA神經網絡的性能評估及局限性

    FPGA實現神經網絡關鍵問題分析基于FPGA的ANN實現方法基于FPGA
    發表于 04-30 06:58

    EdgeBoard神經網絡算子在FPGA實現方法是什么?

    FPGA加速的關鍵因素是什么?EdgeBoard神經網絡算子在FPGA實現方法是什么?
    發表于 09-28 06:37

    FPGA實現大型神經網絡的設計

    1、加速神經網絡的必備開源項目  到底純FPGA適不適合這種大型神經網絡的設計?這個問題其實我們不適合回答,但是FPGA廠商是的實際操作是很有權威性的,現在不論是Intel還是
    發表于 10-24 16:10

    Xilinx Zynq系列FPGA實現神經網絡相關資源評估

    集成在FPGA fabric模塊的RAM,每個xilinxFPGA中集成有多個這樣的BRAM。可以被當作有以下特性的cache:1.不支持像處理器cache
    的頭像 發表于 03-30 10:29 ?1878次閱讀
    <b class='flag-5'>Xilinx</b> <b class='flag-5'>Zynq</b><b class='flag-5'>系列</b><b class='flag-5'>FPGA</b><b class='flag-5'>實現</b><b class='flag-5'>神經網絡</b><b class='flag-5'>中</b><b class='flag-5'>相關</b><b class='flag-5'>資源</b><b class='flag-5'>評估</b>

    如何用OpenCL實現FPGA上的大型卷積網絡加速?

    Xilinx zynq系列FPGA實現神經網絡評估
    的頭像 發表于 04-19 11:12 ?2572次閱讀
    如何用OpenCL<b class='flag-5'>實現</b><b class='flag-5'>FPGA</b>上的大型卷積<b class='flag-5'>網絡</b>加速?

    基于FPGA的RBF神經網絡硬件實現

    基于FPGA的RBF神經網絡硬件實現說明。
    發表于 04-28 11:24 ?26次下載

    基于FPGA神經網絡硬件實現方法

    基于FPGA神經網絡硬件實現方法說明。
    發表于 06-01 09:35 ?37次下載
    基于<b class='flag-5'>FPGA</b>的<b class='flag-5'>神經網絡</b>硬件<b class='flag-5'>實現</b>方法

    如何在FPGA實現神經網絡

    可編程門陣列(FPGA)作為一種靈活、高效的硬件實現方式,為神經網絡的加速提供了新的思路。本文將從FPGA實現
    的頭像 發表于 07-10 17:01 ?1907次閱讀
    主站蜘蛛池模板: 九热这里只有精品| 成人国产亚洲精品A区天堂蜜臀| 日本人69xxx| 伦理片在线线手机版韩国免费观看| 湖南电台在线收听| 国产免费看片| 国产精品婷婷久青青原| 国产99久久久欧美黑人刘玥| 虫族bl文全肉高h| 草民电影网午夜伦理电影网| 99久久婷婷国产综合精品青草| 97在线超碰免费视频| 51久久成人国产精品麻豆| 777EY_卡通动漫_1页| 97蜜桃网123.com| china野外18:19| 草莓视频在线看免费高清观看| 成年人视频在线免费| 纯肉高H啪短文合集| 国产h视频在线观看网站免费| 国产电影无码午夜在线播放| 国产成人高清亚洲一区app| 国产精品成人网| 国模精品一区二区三区视频| 黄色网址在线看| 久久亚洲高清观看| 暖暖视频免费观看视频| 日本三级按摩推拿按摩| 甜性涩爱快播| 亚洲精品无AMM毛片| 中文无码乱人伦中文视频播放| 91精品婷婷国产综合久久8| 9久久99久久久精品齐齐综合色圆| RUNAWAY韩国动漫免费网| 灌满内射HP1V1| 河南老太XXXXXHD| 狂躁美女BBBBBB视频| 欧美亚洲日韩一道免费观看| 丝袜美女被啪啪不带套漫画| 亚洲精品乱码久久久久久v| 中国xxxxx|