色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何解放你的內核?硬件加速器“使用指南”奉上

analog_devices ? 來源:亞德諾半導體 ? 2020-07-06 16:10 ? 次閱讀

有限脈沖響應(FIR)和無限脈沖響應(IIR)濾波器都是常用的數字信號處理算法——尤其適用于音頻處理應用。因此,在典型的音頻系統中,處理器內核的很大一部分時間用于FIR和IIR濾波。數字信號處理器上的片內FIR和IIR硬件加速器也分別稱為FIRA和IIRA,我們可以利用這些硬件加速器來分擔FIR和IIR處理任務,讓內核去執行其他處理任務。在本文中,我們將借助不同的使用模型以及實時測試示例來探討如何在實踐中利用這些加速器。

圖1.FIRA和IIRA系統方框圖。

圖1顯示了FIRA和IIRA的簡化方框圖,以及它們與其余處理器系統和資源的交互方式。

FIRA和IIRA模塊均主要包含一個計算引擎(乘累加(MAC)單元)以及一個小的本地數據和系數RAM。

為開始進行FIRA/IIRA處理,內核使用通道特定信息初始化處理器存儲器中的DMA傳輸控制塊(TCB)鏈。然后將該TCB鏈的起始地址寫入FIRA/IIRA鏈指針寄存器,隨后配置FIRA/IIRA控制寄存器以啟動加速器處理。一旦所有通道的配置完成,就會向內核發送一個中斷,以便內核將處理后的輸出用于后續操作。

從理論上講,最好的方法是將所有FIR和/或IIR任務從內核轉移給加速器,并允許內核同時執行其他操作。但在實踐中,這并非始終可行,特別是當內核需要使用加速器輸出進一步處理,并且沒有其他獨立的任務需要同時完成時。在這種情況下,我們需要選擇合適的加速器使用模型來達到最佳效果。.

在本文中,我們將討論針對不同應用場景充分利用這些加速器的各種模型。

實時使用FIRA和IIRA

圖2.典型實時音頻數據流。

圖2顯示了典型實時PCM音頻數據流圖。一幀數字化PCM音頻數據通過同步串行端口(SPORT)接收,并通過直接存儲器訪問(DMA)發送至存儲器。在繼續接收幀N+1時,幀N由內核和/或加速器處理,之前處理的幀(N-1)的輸出通過SPORT發送至DAC進行數模轉換。

加速器使用模型

如前所述,根據應用的不同,可能需要以不同的方式使用加速器,以最大限度分擔FIR和/或IIR處理任務,并盡可能節省內核周期以用于其他操作。從高層次角度來看,加速器使用模型可分為三類:直接替代、拆分任務和數據流水線。

直接替代

內核FIR和/或IIR處理直接被加速器替代,內核只需等待加速器完成此任務。

此模型僅在加速器的處理速度比內核快時才有效;即,使用FIRA模塊。

拆分任務

FIR和/或IIR處理任務在內核和加速器之間分配。

當多個通道可并行處理時,此模型特別有用。

根據粗略的時序估算,在內核和加速器之間分配通道總數,使二者大致能夠同時完成任務。

如圖3所示,與直接替代模型相比,此使用模型可節省更多的內核周期。

數據流水線

內核和加速器之間的數據流可進行流水線處理,使二者能夠在不同數據幀上并行處理。

如圖3所示,內核處理第N個幀,然后啟動加速器對該幀進行處理。內核隨后繼續進一步并行處理加速器在上一迭代中產生的第N-1幀的輸出。該序列允許將FIR和/或IIR處理任務完全轉移給加速器,但輸出會有一些延遲。

流水線級以及輸出延遲都可能會增加,具體取決于完整處理鏈中此類FIR和/或IIR處理級的數量。

圖3說明了音頻數據幀如何在不同加速器使用模型的三個階段之間傳輸---DMA IN、內核/加速器處理和DMA OUT。它還顯示了通過采用不同的加速器使用模型將FIR/IIR全部或部分處理轉移到加速器上,與僅使用內核模型相比,內核空閑周期如何增加。

圖3.加速器使用模型比較。

SHARC處理器上的FIRA和IIRA

以下ADI SHARC處理器系列支持片內FIRA和IIRA(從舊到新)。

ADSP-214xx(例如,ADSP-21489)

ADSP-SC58x

ADSP-SC57x/ADSP-2157x

ADSP-2156x

這些處理器系列:

計算速度不同

基本編程模型保持不變,ADSP-2156x處理器上的自動配置模式(ACM)除外。

FIRA有四個MAC單元,而IIRA只有一個MAC單元。

ADSP-2156x的FIRA/IIRA改進

ADSP-2156x是SHARC處理器系列中的最新產品。它是第一款單核1 GHz SHARC處理器,其FIRA和IIRA也可在1 GHz下運行。ADSP-2156x處理器上的FIRA和IIRA與其前代ADSP-SC58x/ADSP-SC57x處理器相比,具有多項改進。

性能改進

計算速度提高了8倍(從SCLK-125 MHz至CCLK-1 GHz)。

由于內核和加速器借助專用內核結構實現了更緊密的集成,因此減少了內核和加速器之間的數據和MMR訪問延遲。

功能改進

添加了ACM支持,以盡量減少進行加速器處理所需的內核干預。此模式主要具有以下新特性:

允許加速器暫停以進行動態任務排隊。

無通道數限制。

支持觸發生成(主器件)和觸發等待(從器件)。

為每個通道生成選擇性中斷。

實驗結果

在本節中,我們將討論在ADSP-2156x評估板上,借助不同的加速器使用模型實施兩個實時多通道FIR/IIR用例的結果

用例1

圖4顯示用例1的方框圖。采樣率為48 kHz,模塊大小為256個采樣點,拆分任務模型中使用的內核與加速器通道比為5:7。

表1顯示測得的內核和FIRA MIPS數量,以及與僅使用內核模型相比獲得的節約內核MIPS結果。表中還顯示了相應使用模型增加的額外輸出延遲。正如我們所看到的,使用加速器配合數據流水線使用模型,可節約高達335內核MIPS,但導致1塊(5.33 ms)的輸出延遲。直接替代和拆分任務使用模型也分別可節約98 MIPS和189 MIPS,而且未導致任何額外的輸出延遲。

圖4.用例1方框圖。

表1.用例1的內核和FIR/IIRA MIPS總結

用例2

圖5顯示用例2的方框圖。采樣率為48 kHz,模塊大小為128個采樣點,拆分任務模型中使用的內核與加速器通道比為1:1。

與表1一樣,表2也顯示了此用例的結果。正如我們所看到的,使用加速器配合數據流水線使用模型,可節約高達490內核MIPS,但導致1模塊(2.67 ms)的輸出延遲。拆分任務使用模型可節約234內核MIPS,而沒有導致任何額外輸出延遲。請注意,與用例1中不同,在用例2中內核使用頻域(快速卷積)處理,而非時域處理。這就是為何處理一個通道所需的內核MIPS比FIRA MIPS少的原因,這可導致直接替代使用模型實現負的內核MIPS節約。

圖5.用例2方框圖。

表2.用例2的內核和FIR/IIRA MIPS總結

結論

在本文中,我們看到如何利用不同的加速器使用模型實現所需的MIPS和處理目標,從而將大量內核MIPS轉移到ADSP-2156x處理器上的FIRA和IIRA加速器。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數字信號
    +關注

    關注

    2

    文章

    969

    瀏覽量

    47539
  • 音頻處理
    +關注

    關注

    0

    文章

    84

    瀏覽量

    17765

原文標題:如何解放你的內核?硬件加速器“使用指南”奉上

文章出處:【微信號:analog_devices,微信公眾號:analog_devices】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    《CST Studio Suite 2024 GPU加速計算指南

    許可證模型的加速令牌或SIMULIA統一許可證模型的SimUnit令牌或積分授權。 4. GPU計算的啟用 - 交互式模擬:通過加速對話框啟用,打開求解對話框,點擊“加速”按鈕,打
    發表于 12-16 14:25

    從版本控制到全流程支持:揭秘Helix Core如何成為您的創意加速器

    加速器
    龍智DevSecOps
    發布于 :2024年11月26日 13:42:47

    TDA4VM上的硬件加速運動恢復結構算法

    電子發燒友網站提供《TDA4VM上的硬件加速運動恢復結構算法.pdf》資料免費下載
    發表于 09-24 11:39 ?0次下載
    TDA4VM上的<b class='flag-5'>硬件加速</b>運動恢復結構算法

    AM62A SoC通過硬件加速視覺處理改進條形碼讀取

    電子發燒友網站提供《AM62A SoC通過硬件加速視覺處理改進條形碼讀取.pdf》資料免費下載
    發表于 09-04 09:52 ?0次下載
    AM62A SoC通過<b class='flag-5'>硬件加速</b>視覺處理改進條形碼讀取<b class='flag-5'>器</b>

    適用于數據中心應用中的硬件加速器的直流/直流轉換解決方案

    電子發燒友網站提供《適用于數據中心應用中的硬件加速器的直流/直流轉換解決方案.pdf》資料免費下載
    發表于 08-26 09:38 ?0次下載
    適用于數據中心應用中的<b class='flag-5'>硬件加速器</b>的直流/直流轉換<b class='flag-5'>器</b>解決方案

    圖形圖像硬件加速器卡設計原理圖:270-VC709E 基于FMC接口的Virtex7 XC7VX690T PCIeX8 接口卡

    擴展。軟件支持windows,Linux操作系統。Net FPGA , XC7VX690T板卡 , 軟件無線電處理平臺 , 圖形圖像硬件加速器
    的頭像 發表于 08-06 10:16 ?476次閱讀
    圖形圖像<b class='flag-5'>硬件加速器</b>卡設計原理圖:270-VC709E 基于FMC接口的Virtex7 XC7VX690T PCIeX8 接口卡

    西門子推出Catapult AI NN軟件,賦能神經網絡加速器設計

    西門子數字化工業軟件近日發布了Catapult AI NN軟件,這款軟件在神經網絡加速器設計領域邁出了重要一步。Catapult AI NN軟件專注于在專用集成電路(ASIC)和芯片級系統(SoC)上實現神經網絡的高層次綜合(HLS),為機器學習應用提供了硬件加速的新途徑
    的頭像 發表于 06-19 11:27 ?849次閱讀

    PSoC 6 MCUBoot和mbedTLS是否支持加密硬件加速?

    v3.0,它的上限是 MCUBoot v1.8.1。 當前版本基于 MCUBoot v1.9.1,似乎支持加密硬件加速。 有什么最簡單的方法可以更新我的舊版引導加載,以便運行 MCUBoot v1.9.1? 順便說一下,我的 PSoC 是 CY8C624ABZI-S2
    發表于 05-29 08:17

    Elektrobit利用其首創的硬件加速軟件優化汽車通信網絡的性能

    Elektrobit今日宣布推出 EB zoneo GatewayCore——首款支持、配置和集成現代微控制新一代硬件加速器的軟件產品,可應用于先進的汽車電子/電氣架構(基于被廣泛采用
    的頭像 發表于 04-17 09:51 ?356次閱讀

    用DE1-SOC進行硬件加速的2D N-Body重力模擬設計

    該項目的目標是創建一個用DE1-SOC進行硬件加速的2D N-Body重力模擬。
    的頭像 發表于 04-09 11:08 ?549次閱讀
    用DE1-SOC進行<b class='flag-5'>硬件加速</b>的2D N-Body重力模擬<b class='flag-5'>器</b>設計

    330-基于FMC接口的Kintex-7 XC7K325T PCIeX4 3U PXIe接口卡 圖形圖像硬件加速器

    標簽: Net FPGA , XC7K325T板卡 , XC7K325T處理板 , 軟件無線電處理平臺 , 圖形圖像硬件加速器
    的頭像 發表于 03-04 14:14 ?617次閱讀
    330-基于FMC接口的Kintex-7 XC7K325T PCIeX4 3U PXIe接口卡 圖形圖像<b class='flag-5'>硬件加速器</b>

    【國產FPGA+OMAPL138開發板體驗】(原創)7.硬件加速Sora文生視頻源代碼

    hardware_accelerator_done; // 硬件加速器工作完成的小旗子(幻想中) // FPGA內核操作法則 always @(posedge clk or posedge reset) begin
    發表于 02-22 09:49

    熱敏FET使用指南

    電子發燒友網站提供《熱敏FET使用指南.pdf》資料免費下載
    發表于 02-22 09:35 ?0次下載
    熱敏FET<b class='flag-5'>使用指南</b>

    音視頻解碼硬件加速:實現更流暢的播放效果

    隨著多媒體內容的日益豐富和高清化,傳統的軟件解碼已經難以滿足人們對流暢播放體驗的需求。因此,音視頻解碼硬件加速技術的出現,為提升播放效果帶來了革命性的改變。 硬件加速的原理 硬件加速
    的頭像 發表于 02-21 14:40 ?953次閱讀
    音視頻解碼<b class='flag-5'>器</b><b class='flag-5'>硬件加速</b>:實現更流暢的播放效果

    回旋加速器原理 回旋加速器的影響因素

    回旋加速器(Cyclotron)是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子在恒定強磁場中的運動。本文將詳細介紹回旋加速器的原理以及影響因素。 一、回旋
    的頭像 發表于 01-30 10:02 ?3931次閱讀
    主站蜘蛛池模板: 亚洲欧美精品一中文字幕| 无人影院在线播放视频| 全身无赤裸裸美女网站| 日本精品在线观看视频| 忘忧草研究所 麻豆| 亚洲男人97色综合久久久| 中国老太性色xxxxxhd| 99久久国产露脸国语对白| 成年人视频在线免费看| 国产人妖一区二区| 久久日本精品在线热| 强奷乱码欧妇女中文字幕熟女| 神马电影我不卡国语版| 亚洲欧美中文字幕高清在线| 91精品一区二区综合在线| 边摸边吃奶边做带声音| 国产一区精选播放022| 老女人与小伙子露脸对白| 轻轻挺进女教师的身体| 亚洲AV无码乱码国产麻豆穿越| 在线免费观看a视频| 成人在线免费视频播放| 狠狠色丁香久久婷婷综合_中| 年轻的搜子8中字在线观看| 无人区免费一二三四乱码| 中文无码热在线视频| 粗暴玩烂货调教| 久久精品国产免费| 日本在线免费| 一一本之道高清视频在线观看中文字幕| AV一区AV久久AV无码| 果冻传媒在线播放 免费观看| 暖暖 免费 高清 日本视频5 | 久久亚洲精品中文字幕60分钟| 秋霞伦理电影在线看| 亚洲色欲色欲WWW在线成人网| FREESEXVIDEO 性老少配| 国产最新进精品视频| 奇虎成人网| 亚洲视频在线观看地址| 成人综合在线观看|