色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

神經網絡在FPGA上的應用:深度壓縮方法

454398 ? 來源: AI加速 ? 作者:韓松 ? 2020-11-21 11:00 ? 次閱讀

引言

這篇論文來自文章也幫助深鑒科技在國內外獲得了一定知名度。深度壓縮首先通過剪枝減少了網絡的連接,然后通過比特量化來降低權重量,最后通過無損壓縮方式霍夫曼編碼來縮小存儲空間。作者分別對AlexNet和VGG-16進行了實驗,獲得了35倍和49倍的壓縮量,而且精度幾乎沒有損失。

1. 原理

深度壓縮之所以獲得成功主要是結合了三種壓縮方法:剪枝,量化和無損壓縮霍夫曼編碼,而且在大的數據集和深度神經網絡中獲得了較高壓縮比以及精度未降。前兩種方法不僅僅降低了權重數量,也提高了計算速率。而霍夫曼編碼只是能夠降低存儲空間,在實際計算的時候還需要進行解碼操作,實際上不會提高計算率。

以上三種方法用圖來表示為三個過程:


這三個方法一次順序進行,每個過程都單獨進行。

2. 剪枝

首先進行剪枝操作,也是很傳統的方法,就是通過一定策略來過濾掉一些不重要的神經網絡連接。然后再重新訓練進行參數微調,不斷重復這個過程直到不能夠再進行剪枝為止。剪枝后的神經網絡連接大大減少,剩下的都是對網絡分類有最重要貢獻的連接。其他被剪掉的連接的參數很小,產生的數值對結果影響可以通過重新訓練來微調其他參數而彌補。在imageNet數據集上,剪枝方法可以將AlexNet的參數數量減少9倍而沒有精度上的損失。VGG-16同樣有類似的現象,參數總量可以減少13倍左右而沒有精度損失。



3. 量化

接下來在剪枝網絡上做進一步量化操作。基本思路是權重共享和聚類。假設給定了k個類,這是權重參數量化后可能產生的k個值,然后對權重執行聚類操作,聚類方法選擇了k-means方式。然后會得到k個區間,這些權重參數都分布在這k個區間中。然后用對應k個區間的數值來替代原來的權重數據。K個數值通常需要log2(k)比特來表示。這樣就從原來的32bit降低到了log2(k)。

以下為k-means方法的目標函數:


作者在同一層網絡上進行權重共享,不同層之間的權重分別進行聚類。為什么不同層之間的權重不能夠進行共享?可以這樣想,權重之所以可以共享和量化,是因為其表達的信息有一些共性,從數學上看同一層權重之間是以“求和”方式連接的,而不同層時間是“相乘”關系,后者有一定順序性,無法做到共享。否則會導致較高錯誤率,而且層與層之間還有激活函數,歸一化函數,不能簡單的進行共享。

訓練也進行了量化,在原來權重求得梯度值基礎上進行同樣的聚類和量化操作,然后對量化的權重進行微調得到新的值。過程如下圖所示。這里作者并不是用未量化的梯度來更新權重,用量化的梯度來更新可以減少訓練迭代,在這里只進行了兩次訓練,第一次先訓練出初始權重數據,第二次是用量化的梯度更新權重。


4. 霍夫曼編碼

神經網絡在FPGA上部署通常需要大量的緩存,為了降低緩存空間,霍夫曼編碼進一步來壓縮權重。霍夫曼編碼是一種無損編碼,其通過數據的重復率來進行數據重新編碼,重復率高的用少的比特,重復率少的用多的比特,這樣就降低了數據存儲空間。雖然霍夫曼編碼能壓縮2到3倍權重,但是并不適合在FPGA上實現。因為霍夫曼解碼要消耗大量資源,同時霍夫曼解碼是單bit進行解析,速度較慢。這些都不利于FPGA上加速深度神經網絡。

5. 實驗結果

作者主要在AlexNet和VGG-16上進行了嘗試,結果如圖:


從結果中可以獲得以下結論:
1) 全連接層的剪枝和量化都很大,說明全連接層信息有很大冗余;
2) 越深的網絡壓縮比例越大;

結論

本文介紹了深度壓縮方法,其結合了剪枝,量化和霍夫曼編碼的方式來最大限度降低權重數據量,這種方法促進了深度神經網絡在FPGA器件上的應用能力。

編輯:hfy


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1629

    文章

    21735

    瀏覽量

    603172
  • 神經網絡
    +關注

    關注

    42

    文章

    4771

    瀏覽量

    100745
收藏 人收藏

    評論

    相關推薦

    脈沖耦合神經網絡FPGA的實現誰會?

    脈沖耦合神經網絡(PCNN)FPGA的實現,實現數據分類功能,有報酬。QQ470345140.
    發表于 08-25 09:57

    基于賽靈思FPGA的卷積神經網絡實現設計

    FPGA 實現卷積神經網絡 (CNN)。CNN 是一類深度神經網絡處理大規模圖像識別任務
    發表于 06-19 07:24

    如何設計BP神經網絡圖像壓縮算法?

    (Digital Signal Processor)相比,現場可編程門陣列(Field Programma-ble Gate Array,FPGA)神經網絡的實現更具優勢。DSP處
    發表于 08-08 06:11

    基于FPGA神經網絡的性能評估及局限性

    FPGA實現神經網絡關鍵問題分析基于FPGA的ANN實現方法基于FPGA神經網絡的性能評估及局
    發表于 04-30 06:58

    深度神經網絡是什么

    多層感知機 深度神經網絡in collaboration with Hsu Chung Chuan, Lin Min Htoo, and Quah Jia Yong. 與許忠傳,林敏濤和華佳勇合作
    發表于 07-12 06:35

    EdgeBoard中神經網絡算子FPGA中的實現方法是什么?

    FPGA加速的關鍵因素是什么?EdgeBoard中神經網絡算子FPGA中的實現方法是什么?
    發表于 09-28 06:37

    基于深度神經網絡的激光雷達物體識別系統

    的激光雷達物體識別技術一直難以嵌入式平臺上實時運行。經緯恒潤經過潛心研發,攻克了深度神經網絡嵌入式平臺部署所面臨的算子定制與加速、量化策略、模型
    發表于 12-21 07:59

    卷積神經網絡模型發展及應用

    network,DBN)[24], 從此拉開了深度學習大幕。隨著深度學習理論的研究和發展,研究人員提 出了一系列卷積神經網絡模型。為了比較不同模型 的質量,收集并整理了文獻中模型
    發表于 08-02 10:39

    深度神經網絡壓縮和正則化剖析

    到只有有限硬件資源的嵌入式系統。 為了解決這個限制,可以使用深度壓縮來顯著地減少神經網絡所需要的計算和存儲需求。例如對于具有全連接層的卷積神經網絡
    發表于 11-16 13:11 ?1827次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>神經網絡</b>的<b class='flag-5'>壓縮</b>和正則化剖析

    深度神經網絡識別物體的能力怎樣

    深度神經網絡非常善于識別物體,但是當涉及到他們的相互作用的推理時,即使是最先進的神經網絡努力。
    發表于 04-14 15:24 ?842次閱讀

    基于深度神經網絡的端到端圖像壓縮方法

    人工設計的算法分別進行優化近年來,基于深度神經網絡的端到端圖像壓縮方法圖像壓縮中取得了豐碩的成
    發表于 04-08 09:30 ?16次下載
    基于<b class='flag-5'>深度</b><b class='flag-5'>神經網絡</b>的端到端圖像<b class='flag-5'>壓縮</b><b class='flag-5'>方法</b>

    深度神經網絡模型的壓縮和優化綜述

    近年來,隨著深度學習的飛速發展,深度神經網絡受到了越來越多的關注,許多應用領域取得了顯著效果。通常,較高的計算量下,
    發表于 04-12 10:26 ?20次下載
    <b class='flag-5'>深度</b><b class='flag-5'>神經網絡</b>模型的<b class='flag-5'>壓縮</b>和優化綜述

    基于FPGA神經網絡硬件實現方法

    基于FPGA神經網絡硬件實現方法說明。
    發表于 06-01 09:35 ?37次下載
    基于<b class='flag-5'>FPGA</b>的<b class='flag-5'>神經網絡</b>硬件實現<b class='flag-5'>方法</b>

    卷積神經網絡壓縮方法

    卷積神經網絡(Convolutional Neural Network, CNN)作為深度學習領域的重要分支,圖像識別、視頻處理、自然語言處理等多個領域取得了顯著成就。然而,隨著網絡
    的頭像 發表于 07-11 11:46 ?348次閱讀

    FPGA深度神經網絡中的應用

    、低功耗等特點,逐漸成為深度神經網絡邊緣計算和設備端推理的重要硬件平臺。本文將詳細探討FPGA深度
    的頭像 發表于 07-24 10:42 ?671次閱讀
    主站蜘蛛池模板: 久久亚洲AV成人无码国产漫画| 天天啪免费视频在线看| 国产AV麻豆出品在线播放| 亚洲视频中文| 成年色黄APP下载| 一本道久久综合久久88| 谁有成人网站地址| 久热久热精品在线观看| 97国产视频| 欧美片第1页 综合| 成人免费看片45分钟| 亚洲欧美一区二区久久| 色偷偷7777www| 精品国产福利在线视频| 俄罗斯bbbbbbbbb大片| 99草在线观看| 神马影院午夜伦理限级| 内射后入在线观看一区| 久久草这在线观看免费| 国产精品一久久香蕉国产线看| 百性阁论坛首页| 97色在线视频| 中国女人内谢69xxxxxx直播| 亚洲精品福利在线| 亚洲成AV人片一区二区不卡| 色偷偷男人| 人妻熟女斩五十路0930| 欧美激情一区二区三区AA片| 乱码午夜-极品国产内射| 动漫AV纯肉无码AV电影网| 亚洲成A人片在线观看中文不卡| 日本久久精品免视看国产成人| 男女无遮挡吃奶gift动态图| 两个奶被男人揉了一个晚上| 久久九九青青国产精品| 久久99国产精品二区不卡| 后入到高潮免费观看| 火影忍者高清无码黄漫| 红豆视频免费资源观看| 九九热在线观看视频| 教室里的激情电影|