色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

采用硬件加速實現的基本思維有哪些

FPGA自習室 ? 來源:FPGA自習室 ? 作者:FPGA自習室 ? 2021-06-30 15:37 ? 次閱讀

很多圖像算法不涉及對顏色的識別,僅需要識別灰度目標的變化即可,因此很多時候需要將彩色圖像轉換為灰度圖像,在進行進一步的處理。彩色轉灰度計算公式如下:Y=0.299*R + 0.587*G + 0.144*B,作者以05年的嵌入式系統計算,采用640*480的圖像進行試驗,一系列的圖像優化如下(只是類比,不要太在意數據):

1)一維數組索引比三維快,因此先將RGB三維數組轉成一維數組,再直接用上述公式進行計算,嵌入式系統計算時間為120秒;

2)由于Windows位圖是ARGB8888的精度,因此計算結果僅需要8bit整形,可忽略小數,假定左右擴大1000倍去轉定點計算,則新的公式如下:Y=(299R + 587*G + 144*B)/1000,此時嵌入式系統計算時間加快到45秒;

3)除法計算太慢,擴大2N次方可轉移位操作,假定擴大4096倍轉定點,則新的公式如下:Y=(R*1224+G*2404+B*467)>>12,計算進一步加快到30秒;

4)由于RGB的取值是固定的[0,255],因此公式中每一步運算其實都可以提前計算好,然后直接索引——查找表,這樣將執行計算轉換成了執行索引,此時再測試計算速度驚人的提升到了2秒;

5)接著作者再馬力全開,采用2個ALU并行計算,并且將查找表從int型改成unsigned short型,以及函數聲明為inline,減少CPU的調用開銷,最后在嵌入式系統上將計算速度提升到了0.5秒。

以上為conquer 05年《讓你的軟件飛起來》中的相關數據,通過軟件優化的提升,從最初的120S提升到了0.5S,將近240倍,足以見得一個優秀的軟件工程師的重要性,也許IOS和Windows的性能差距那么大,也由此方面原因吧。

8dcbbfca-d8d3-11eb-9e57-12bb97331649.png

目前多媒體視頻普遍到了2K/4K的分辨率,以4K視頻為例,其運算量是640*480的30.7倍((4096*2304)/(640*480)≈30.7),那么0.5*30.7=15.35秒怎么做到實時視頻處理/顯示呢(60FPS下單幀16.667ms),差92000倍呢。PC采用GPU加速處理完成圖形運算,但如果是終端產品,如果沒有昂貴的CPU,也沒有其他加速引擎,那簡直天方夜譚。那么,此時主角該上場了——硬件加速器,讓我們開始他的表演。
以4096*2304的4K60視頻RGB轉YUV為例,進行硬件思維的加速計算解說。不管是FPGA還是ASIC,以門級電路并行加速運算,時序邏輯每個時鐘翻轉完成一次計算。前面《讓你的軟件飛起來》中(2)已經完成了定點化,然后(3)采用乘法+移位的方式實現,(4)采用查找表再累加的方式實現。單從效率上考慮,兩者計算一個像素的灰度均耗用3個CLK(乘法、累加、移位,或給RAM地址、讀RAM數據,累加);但從資源上對比,前者占用3個乘法器和2個加法器,乘法器數量不多,但是綜合速率受器件的限制,后者則需要3個19bit*256深度的RAM,占用了更多的面積,綜合速率上也受到RAM的限制。兩者都用了專用單元庫,但采用硬件乘法器面積更小,且靈活性更強,工作量也更小(不用專門去生成),因此用硬件加速首選采用優化方式(3),具體實現流水線如下:

STEP1:采用三個乘法器,并行計算當前輸入像素的RGB通道乘法,即R*1224,G*2404, B*467;

STEP2:將上述三個結果直接進行累加;同時計算下一個像素的STEP1操作;

STEP3:將累加后的結果向右移動12bit,取低8bit得到最后的結果;同時計算下一個像素的STEP1,STEP2。

8e206b9c-d8d3-11eb-9e57-12bb97331649.png

以流水線式循環操作完一副完整的圖像,如果是輸入到下一級算法處理,則整體的延時僅為3個CLK,因為三個時鐘后得到灰度圖像的1個像素,立馬可以進行下一級運算;如果圖像寫回緩存,我們再來精算一下:以主頻250MHz為例(事實上28nm ASIC跑500MHz甚至1GHz都不是問題,FPGA 45nm的250MHz也沒有問題),則需要(4096*2304+2)*4ns=37.75ms>16.667ms。

8e46f8e8-d8d3-11eb-9e57-12bb97331649.png

直接流水線實現,貌似這還不夠滿足我們實時的需求,畢竟很多運算需要從內存中來,回到內存中去,還得給別的算法預留時間,彩色轉灰度這只是算法的第一步而已,復雜的還沒來呢。那我們繼續想辦法突變限制,充分利用硬件加速,挑戰不可能。既然采用門級電路,那不存在線程的約束,然而我們已經采用了流水線并行計算灰度值,那進一步想是否可以同時計算n個像素的灰度值呢?答案是肯定的,如下圖所示:

8e840436-d8d3-11eb-9e57-12bb97331649.png

假設DDR控制器位寬是256bit,則一次性可以讀取32個pixel的數據,32個像素同時計算需要96個乘法器,64個加法器,這些資源的需求甚至對低端的FPGA都不是問題,對于ASIC來說沒有太大的面積影響。因此還是在主頻250MHz,DDR控制器帶寬256bit條件下,我們處理一副4096*2304彩轉灰圖像的時間為:37.35/32≈1.17ms<16.667ms,采用并行運算提升32倍效率后,4K圖像僅需要1.17ms,完全能夠滿足實時性,甚至還給后續算法預留了90%以上的時間,可以滿足系統的需求。

綜上,采用硬件加速實現的幾種基本思維,總結如下:

1)浮點轉定點,硬件乘法+移位實現加速;

2)資源夠的前提下,充分利用并行計算,在單位時間提升計算量;

3)充分利用流水線特性,算法采用Pipeline的方式進行計算,能不回內存就不回內存,能用localbuffer就用localbuffer;

4)盡量少用CPU參與計算,硬件自動完成狀態跳轉,除非最終結果浮點等復雜的運算;

文章出處:【微信公眾號:FPGA自習室】

責任編輯:gt

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1629

    文章

    21748

    瀏覽量

    603863
  • 控制器
    +關注

    關注

    112

    文章

    16382

    瀏覽量

    178311
  • 分辨率
    +關注

    關注

    2

    文章

    1067

    瀏覽量

    41949

原文標題:圖像處理硬件加速引擎——不斷突破限制(下)

文章出處:【微信號:FPGA_Study,微信公眾號:FPGA自習室】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    支持5點手寫硬件加速視頻演示-VS680與智慧教室解決方案

    硬件
    深蕾半導體
    發布于 :2024年12月03日 16:01:19

    基于Xilinx XCKU115的半高PCIe x8 硬件加速

    基于Xilinx XCKU115的半高PCIe x8 硬件加速卡,支持2x72bit(數據位寬64bit+ECC)DDR4存儲,數據傳輸速率 2400Mb/s。DDR4單簇容量4GB,兩組總容量為8GB
    的頭像 發表于 11-14 11:30 ?274次閱讀
    基于Xilinx XCKU115的半高PCIe x8 <b class='flag-5'>硬件加速</b>卡

    FPGA加速深度學習模型的案例

    FPGA(現場可編程門陣列)加速深度學習模型是當前硬件加速領域的一個熱門研究方向。以下是一些FPGA加速深度學習模型的案例: 一、基于FPGA的AlexNet卷積運算加速 項目名稱
    的頭像 發表于 10-25 09:22 ?239次閱讀

    RISC-V跑AI算法能加速嗎?

    現在好多ARM單片機都帶機器學習加速,RISC-V有這方面的硬件加速嗎?
    發表于 10-10 22:14

    TDA4VM上的硬件加速運動恢復結構算法

    電子發燒友網站提供《TDA4VM上的硬件加速運動恢復結構算法.pdf》資料免費下載
    發表于 09-24 11:39 ?0次下載
    TDA4VM上的<b class='flag-5'>硬件加速</b>運動恢復結構算法

    AM62A SoC通過硬件加速視覺處理改進條形碼讀取器

    電子發燒友網站提供《AM62A SoC通過硬件加速視覺處理改進條形碼讀取器.pdf》資料免費下載
    發表于 09-04 09:52 ?0次下載
    AM62A SoC通過<b class='flag-5'>硬件加速</b>視覺處理改進條形碼讀取器

    適用于數據中心應用中的硬件加速器的直流/直流轉換器解決方案

    電子發燒友網站提供《適用于數據中心應用中的硬件加速器的直流/直流轉換器解決方案.pdf》資料免費下載
    發表于 08-26 09:38 ?0次下載
    適用于數據中心應用中的<b class='flag-5'>硬件加速</b>器的直流/直流轉換器解決方案

    PSoC 6 MCUBoot和mbedTLS是否支持加密硬件加速

    。 使用 MCUBoot 驗證兩個應用程序時,運行時間大約需要五秒鐘。 在 README.md 的 \"安全 \"一欄中寫道 與軟件實現相比,硬件加速加密技術將啟動時間縮短了四倍多
    發表于 05-29 08:17

    新思科技硬件加速解決方案技術日在成都和西安站成功舉辦

    近日,【新思科技技術日】硬件加速驗證解決方案專場成都站和西安站順利舉行,來自國內領先的系統級公司、芯片設計公司以及高校的250多名開發者們積極參與。
    的頭像 發表于 04-19 17:35 ?455次閱讀

    Elektrobit利用其首創的硬件加速軟件優化汽車通信網絡的性能

    Elektrobit今日宣布推出 EB zoneo GatewayCore——首款支持、配置和集成現代微控制器新一代硬件加速器的軟件產品,可應用于先進的汽車電子/電氣架構(基于被廣泛采用
    的頭像 發表于 04-17 09:51 ?375次閱讀

    用DE1-SOC進行硬件加速的2D N-Body重力模擬器設計

    該項目的目標是創建一個用DE1-SOC進行硬件加速的2D N-Body重力模擬器。
    的頭像 發表于 04-09 11:08 ?571次閱讀
    用DE1-SOC進行<b class='flag-5'>硬件加速</b>的2D N-Body重力模擬器設計

    330-基于FMC接口的Kintex-7 XC7K325T PCIeX4 3U PXIe接口卡 圖形圖像硬件加速

    標簽: Net FPGA , XC7K325T板卡 , XC7K325T處理板 , 軟件無線電處理平臺 , 圖形圖像硬件加速
    的頭像 發表于 03-04 14:14 ?627次閱讀
    330-基于FMC接口的Kintex-7 XC7K325T PCIeX4 3U PXIe接口卡 圖形圖像<b class='flag-5'>硬件加速</b>器

    【國產FPGA+OMAPL138開發板體驗】(原創)7.硬件加速Sora文生視頻源代碼

    信號 text_ready <= 0; end // 文本處理與視頻生成(占位符,調用硬件加速器或實現相應算法) if (text_processing &&
    發表于 02-22 09:49

    音視頻解碼器硬件加速實現更流暢的播放效果

    思想是利用專門的硬件資源,如GPU或專用的解碼芯片,來分擔原本由CPU承擔的解碼任務。這種方式不僅可以大幅提高解碼速度,還能降低CPU的負載,從而實現更流暢的播放效果。 硬件加速的優勢 高效性能 :
    的頭像 發表于 02-21 14:40 ?990次閱讀
    音視頻解碼器<b class='flag-5'>硬件加速</b>:<b class='flag-5'>實現</b>更流暢的播放效果

    KubeCASH:基于軟硬件融合的容器管理平臺

    Kubernetes(K8S)雖然強大,但也有劣勢,劣勢在于K8S主要基于CPU平臺。有的朋友可能會說,不是CDI嗎,可以實現硬件加速器的支持。但其實CDI能做的事情非常有限,CRI、CNI
    的頭像 發表于 01-08 10:16 ?1321次閱讀
    KubeCASH:基于軟<b class='flag-5'>硬件</b>融合的容器管理平臺
    主站蜘蛛池模板: 一个人在线观看免费高清视频| 色大姐综合网| 热久久2018亚洲欧美| 一本道色综合手机久久| 国产三级影院| 脱jk裙的美女露小内内无遮挡| xiao776唯美清纯| 欧美xxxxb| xxxx69动漫| 人人插人人射| 饱满奶大30p| 日本视频一区二区免费观看| gogogo在线观看| 日本久久精品毛片一区随边看| china野外18:19| 青青草原亚洲| 成人在线免费视频播放| 日本六九视频| 国产成人99久久亚洲综合精品| 特黄特色大片免费播放器9| 国产成人国产在线观看入口| 偷拍自怕亚洲在线第7页| 国产精品视频免费观看| 亚洲粉嫩美白在线| 久99视频精品免费观看福利| 伊人久久国产| 欧美 日韩 亚洲 在线| 粗壮挺进邻居人妻无码| 天天操天天干天天透| 国语自产一区视频| 又粗又大又爽又黄的免费视频| 美女扣逼软件| 高h 纯肉文| 亚洲日韩成人| 男人脱女人衣服吃奶视频| 成人小视频在线免费观看| 午夜亚洲WWW湿好大| 久久aa毛片免费播放嗯啊| 99无人区码一码二码三| 十八禁啪啦啪漫画| 久久精品熟女亚洲AV国产|