色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于RISC-V軟核CPU的國產FPGA CNN異構方案的實現

紫光同創官微 ? 來源:紫光同創官微 ? 作者:紫光同創官微 ? 2022-11-18 11:04 ? 次閱讀

摘要:現場可編程門陣列(FPGA)具有低功耗、高性能和靈活性的特點。FPGA神經網絡加速的研究正在興起,但大多數研究都基于國外的FPGA器件。為了改善國內FPGA的現狀,提出了一種新型的卷積神經網絡加速器,用于配備輕量級RISC-V軟核的國產FPGA(紫光同創PG2L100H)。所提出的加速器的峰值性能達到153.6 GOP/s,僅占用14K LUT(查找表)、32個DRM(專用RAM模塊)和208個APM(算術處理模塊)。所提出的加速器對于大多數邊緣AI應用和嵌入式系統具有足夠的計算能力,為國內FPGA提供了可能的AI推理加速方案。

背景

卷積神經網絡在機器視覺任務中越來越流行,包括圖像分類和目標檢測。如何在有限的條件下充分發揮FPGA的最大性能是各研究者的主要方向。如今,大多數CCN使用外國FPGA器件。由于國內FPGA起步較晚,其相關開發工具和設備落后于其他外國制造商。因此,在國內FPGA上構建高性能CNN并替換現有成熟的異構方案是一項具有挑戰性的任務。

Zhang[1]于2015年首次對卷積網絡推理中的數據共享和并行性進行了深入分析和探索。Guo[2]提出的加速器在214MHz下達到了84.3 GOP/s的峰值性能。2016年,Qiu[3]更深入地探索了使用行緩沖器的加速器。本文提出了一種更高效、更通用的卷積加速器。提出的加速器峰值性能達到153.6GOP/s,僅占用14K LUT、32個DRM和208個APM。本文的章節安排如下,第2節介紹了我們提出的加速器的詳細設計以及基于RISC-V的加速器實現的控制調度方案。第3節給出了實驗結果。

系統設計

整個RISC-V片上系統設計如圖1所示。該系統主要由RISC-V軟核CPU、指令/數據存儲器、總線橋、外圍設備、DMA(直接存儲器訪問)和卷積加速器組成。

bd2cb078-66ec-11ed-8abf-dac502259ad0.png

Fig. 1. 片上RISC-V系統設計圖

我們的工作主要在三個方面。首先,我們使用軟核CPU作為片上系統的主控,控制外設,DMA,CNN加速器來實現數據調度和操作。其次,1D(一維)加速器被設計用于改變緩沖機制。第三,為紫光同創的FPGA設備設計了一個DMA IP,用于卷積加速的應用。

A、RISC-V 軟核CPU 架構

軟核。使用RISC-V軟核VexRiscv代替Ibex[4]構建RISC-V的片上系統和面向軟件的方法可以使VexRiscv具有高度的靈活性和可擴展性。

接口I2C和SPI等外圍設備通過APB3總線連接到RISC-V軟核。DMA和加速器通過PMB總線連接到RISC-V軟核。

指令與數據存儲。程序被交叉編譯以獲得一個特定的文件,該文件由JTAG燒錄到片上指令/數據存儲器中。

B、CNN 加速器結構

輸入緩存。使用乒乓緩存來實現緩沖區,可以有效地提高吞吐量。

輸出緩存。權重緩存模塊由一系列分布式RAM和串行到并行單元組成。

卷積。圖2中的1D卷積模塊分為四組,其中包含四個1D卷曲單元。每個單元負責1D卷積的一個信道。

合并。積分模塊有四組加法器樹。每組加法器樹將每組卷積運算單元的結果相加,得到單向輸出結果。

累加。累加模塊中有四組FIFO和四個加法器。加速器一次只能接收四個通道的輸入特征圖數據。

量化。該量化模塊由乘法單元和移位單元組成。它通過比例變換將24位累加結果重新轉換為8位[5]。

激活。激活功能通過查找由一系列分布式RAM組成的表來實現。它存儲ReLu、Leaky ReLu和sigmoid函數的INT8函數表。

池化。確定當前卷積層是否與池化層級聯,然后決定是否使用池化模塊來完成池化操作。

輸出緩存。輸出緩沖器由FIFO而不是乒乓緩存實現。輸出高速緩存FIFO將結果存儲回片外存儲器,作為下一卷積層的輸入。

bd469cd6-66ec-11ed-8abf-dac502259ad0.png

Fig. 2. CNN 加速器實現

C、DMA 結構

神經網絡不僅對計算能力有很高的要求,而且對內存也有很大的需求。中低端FPGA通常需要DDR SRAM(雙數據速率同步動態隨機存取存儲器)來承載整個神經網絡和所有中間運算結果的權重。紫光同創的FPGA的DDR3內存驅動器IP為用戶提供了簡化AXI4總線的內存訪問接口。

由于Simpled AXI和AXI之間的標準差異,需要新的DMA設計。DMA設計如下。讀和寫地址通道由RISC-V軟核直接控制。讀寫數據通道的FIFO用作卷積加速器和DDR3驅動器IP的緩沖器,以完成端口轉換。

D、實現細節

1、一維卷積單元陣列設計

神經網絡不僅對計算能力有很高的要求,而且對內存也有很大的需求。中低端FPGA通常需要DDR SRAM(雙數據速率同步動態隨機存取存儲器)來承載整個神經網絡和所有中間運算結果的權重。紫光同創的FPGA的DDR3內存驅動器IP為用戶提供了簡化AXI4總線的內存訪問接口。

由于Simpled AXI和AXI之間的標準差異,需要新的DMA設計。DMA設計如下。讀和寫地址通道由RISC-V軟核直接控制。讀寫數據通道的FIFO用作卷積加速器和DDR3驅動器IP的緩沖器,以完成端口轉換。

2、卷積加速器控制

本文提出了一種基于指令隊列的設計,以減少RISC-V軟核中DMA和加速器的響應延遲。RISC-V CPU可以連續發送多個存儲器讀寫請求指令和多個操作調度控制指令,而不用等待DMA和加速器的反饋。DMA和加速器從隊列中獲取指令,任務完成后直接從隊列中取出下一條指令,無需等待相應的CPU,從而實現低延遲調度。

bd61ff08-66ec-11ed-8abf-dac502259ad0.png

Fig. 3. 1X3 一維卷積原理圖

bd75d1c2-66ec-11ed-8abf-dac502259ad0.png

Fig. 4. 一維卷積單元硬件實現

實現結果和備注

通過在PG2L100H和X7Z020上實現相同配置的CNN加速器,完成了CNN加速器的性能測試,驗證了國產FPGA CNN加速方案的可行性。加速器的資源消耗和性能如表I和表II所示。

bd89414e-66ec-11ed-8abf-dac502259ad0.png

TABLE I 資源利用

PG2L100H和X7Z020的資源消耗相似。PG2L100H需要額外的邏輯資源來構建VexRiscv CPU,而X7Z020為AXI DMA IP使用更多的邏輯資源。就加速器性能而言,可從表II中看出。由于FPGA器件架構的差異,與X7Z020相比,加速器的卷積運算在PG2L100H上只能在200MHz下實現更好的收斂。RISC-V軟核只能在100MHz下實現定時收斂。

bda6cc50-66ec-11ed-8abf-dac502259ad0.png

TABLE II 性能對比

我們提出了一種基于RISC-V的一維卷積運算的新設計。該加速器在國內FPGA上的實現和部署已經完成,其性能與具有相同規模硬件資源的國外FPGA相當。

本文論證了基于國產FPGA的CNN異構方案的可行性,該研究是國產FPGA應用生態中CNN加速領域的一次罕見嘗試。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1629

    文章

    21729

    瀏覽量

    603010
  • 存儲器
    +關注

    關注

    38

    文章

    7484

    瀏覽量

    163765
  • RISC-V
    +關注

    關注

    45

    文章

    2270

    瀏覽量

    46131
收藏 人收藏

    評論

    相關推薦

    SiFive 推出高性能 Risc-V CPU 開發板 HiFive Premier P550

    一波 RISC-V 開發浪潮。P550 Premier 采用 ESWIN EIC7700X SoC,配備四 SiFive P550 64 位 OOO CPU 集群,為開發人員提供了創建高性能
    的頭像 發表于 12-16 11:16 ?138次閱讀
    SiFive 推出高性能 <b class='flag-5'>Risc-V</b> <b class='flag-5'>CPU</b> 開發板 HiFive Premier P550

    RISC-V能否復制Linux 的成功?》

    個角度來看,RISC-V ISA是推動RISC-V發展的關鍵因素。回想20年前,基于Linux內核的實現方案非常多,遠遠超過今天基于RISC-V
    發表于 11-26 20:20

    飛凌嵌入式T113-i開發板RISC-V的實時應用方案

    RISC-V作為一種開源指令集架構,以其簡潔性、一致性、可擴展性以及高編譯效率,為實時性處理場景提供了強大的支持。將ARISC-V結合作為單芯多核
    的頭像 發表于 11-22 15:29 ?1103次閱讀
    飛凌嵌入式T113-i開發板<b class='flag-5'>RISC-V</b><b class='flag-5'>核</b>的實時應用<b class='flag-5'>方案</b>

    RISC-V發展及FPGA廠商為什么選擇RISC-V

    Microsemi 于 2017 年開始在其 FPGA 中提供 RISC-V ,Lattice 于 2020 年開始提供,英特爾 (Altera) 于 2021 年開始提供,因此
    的頭像 發表于 11-11 10:24 ?342次閱讀
    <b class='flag-5'>RISC-V</b>發展及<b class='flag-5'>FPGA</b>廠商為什么選擇<b class='flag-5'>RISC-V</b>

    國產RISC-V案例分享,基于全志T113-i異構多核平臺!

    RISC-V核心優勢全志T113-i是一款雙Cortex-A7@1.2GHz國產工業級處理器平臺,并內置玄鐵C906 RISC-V和HiFi4 DSP雙副核心,可流暢運行Linux系
    發表于 10-29 09:47

    國產RISC-V基于全志T113-i異構多核平臺

    全志T113-i是一款雙Cortex-A7@1.2GHz國產工業級處理器平臺,并內置玄鐵C906 RISC-V和HiFi4 DSP雙副核心,可流暢運行Linux系統與Qt界面,并已適配
    發表于 10-10 22:08

    基于國產異構(RISC-V+FPGA)處理器,AG32開發板開發資料

    基于國產異構(RISC-V+FPGA)處理器,AG32VF407系列32位微控制器相當于主頻248MHZMCU+2KLES(FPGA)。
    發表于 09-02 17:13

    淺談國產異構RISC-V+FPGA處理器AG32VF407的優勢和應用場景

    關于國產異構RISC-V+FPGA處理器AG32VF407的具體優勢和應用場景淺談如下: 優勢 異構計算能力 :
    發表于 08-31 08:32

    Imagination CPU 系列研討會 | RISC-V 平臺的性能分析和調試

    為了讓開發者及工程師深入了解Imagination的CPU產品及相關解決方案,Imagination將陸續推出5期線上研討會,包含:RISC-V平臺的性能分析和調試;RISC-V安全和
    的頭像 發表于 08-10 08:28 ?285次閱讀
    Imagination <b class='flag-5'>CPU</b> 系列研討會 | <b class='flag-5'>RISC-V</b> 平臺的性能分析和調試

    國產RISC-V芯片性能穩定嗎?

    想使用國產RISC-V架構的芯片做無人機投送快遞的方案,可行性高嗎?國產RISC-V MCU穩定么?
    發表于 05-20 15:43

    國產RISC-V MCU推薦

    高速PHY收發器(480Mbps)、千兆以太網MAC及10兆物理層收發器等。 沁恒的另一顆芯片 xiaolinen認為在選擇國產RISC-V MCU時,需要重點考慮生態問題,碰到問題是否能快速的找到
    發表于 04-17 11:00

    Achronix與Bluespec聯合宣布推出一款支持Linux的RISC-V處理器

    高性能FPGA芯片和嵌入式FPGA(eFPGA)硅知識產權(IP)領域的領先企業Achronix半導體公司,以及RISC-V工具和IP領域的行業領導者Bluespec有限公司,日前聯合
    的頭像 發表于 04-15 16:23 ?576次閱讀

    品讀《基于FPGARISC-V的嵌入式系統設計》

    曾經何時,偶然間獲得了這本書,這本是來自清華大學出版社的,作者顧長怡。此書比較詳細介紹了RISC-V指令集和其背后的設計思想,并且涉及到一種稱為FARM的軟硬件開發模式,將FPGARISC-V
    發表于 03-29 00:06

    瑞薩推出采用自研CPU內核的通用32位RISC-V MCU 加強RISC-V生態系統布局

    瑞薩推出采用自研CPU內核的通用32位RISC-V MCU 加強RISC-V生態系統布局 RISC-V MCU為開發人員帶來低功耗、高性能的全新選擇以及全面工具鏈支持。 全球半導體解決
    發表于 03-28 19:00 ?576次閱讀

    Imagination:RISC-V CPU的重要力量

    根據SHD集團最近發布的報告顯示,RISC-V正全速發展中。通過分析從2021年到2030年這十年間RISC-V在不同應用和功能領域的潛在市場,作者RichWawrzyniak得出結論稱,到
    的頭像 發表于 03-07 08:26 ?755次閱讀
    Imagination:<b class='flag-5'>RISC-V</b> <b class='flag-5'>CPU</b>的重要力量
    主站蜘蛛池模板: 强姧伦久久久久久久久| 日本精品在线观看视频| 99国内精品| 高中生高潮抽搐喷出白浆视频| 美丽的姑娘BD在线观看| 亚洲精品高清视频| younv 学生国产在线视频| 久见久热 这里只有精品| 三级网站午夜三级| 99久久无码热高清精品| 久久亚洲精品成人| 99精品观看| 乱奷XXXXXHD| 19十主播福利视频| 男人到天堂a在538线| 在线观看视频中文字幕| 宫交拔不出来了h黑人| 午夜dj免费中文字幕| 中文字幕偷乱免费视频在线| 国产亚洲精品久久久久久禁果TV| 女张腿男人桶羞羞漫画| a级老头和老太xxxx| 内射爽无广熟女亚洲| 中文国产乱码在线人妻一区二区 | 曰本真人00XX动太图| 精品高潮呻吟99AV无码视频| 久久精品成人免费看| 在线观看视频国产| 美女被黑人巨大进入| 广东95后小情侣酒店自拍流出| 日本在线免费| 国产成人一区二区三中文 | 精品国产乱码久久久久久免费 | 三男强一女90分钟在线观看| 亚洲一级毛片免费在线观看| 国产小视频免费看| 在线观看免费av网| 午夜剧场1000| 女生下面免费看| 挤奶门事件完整照片| AV天堂午夜精品一区|