性xxxx中国,在线视频成人,天天天综合网

0 引言

2006年，CANDES D E等人提出了壓縮感知（Compressed Sensing，CS）理論[1]，CS理論利用與表達基不相干的觀測矩陣，以低于奈奎斯特的采樣速率非自適應地采樣可稀疏表示的信號，得到低維的離散信息矢量，該信息矢量包含了原始信號的全部信息，然后通過非線性重建算法完美地重建信號。

壓縮感知理論主要包含了三大核心部分：信號的稀疏表示、測量矩陣的構造和信號重構算法的設計。在壓縮感知理論的三個核心問題中，如何設計并用硬件實現根據離散信息樣點準確重構原始信號的行之有效的算法是該理論中較為重要的一環。目前，壓縮感知信號重構算法主要分為兩類：基于凸松弛的優化算法，如基追蹤（Basis Pursuit，BP）算法；

基于貪婪迭代的匹配追蹤算法，如OMP算法[2]。這兩類算法各有優缺點：凸松弛算法具有很好的魯棒性，然而由于需要將求解問題轉化為線性規劃問題，計算量大，信號重構效率低；貪婪算法雖然不具有強保證性，但實現簡單，重構效率高，在工程應用中得到廣泛使用[3]。

首次對壓縮感知恢復算法進行VLSI設計是在參考文獻[4]中，而之后，有文獻進行優化設計。參考文獻[5]根據OMP算法必須按照特定順序執行這一特征，采用資源復用技術，提高了資源利用率。參考文獻[6]設計了一個快速求逆平方根算法，在矩陣分解部分采用QR算法。參考文獻[7]對OMP算法進行優化，減少了計算延時。參考文獻[8]同時進行了OMP算法和AMP算法的VLSI設計。本文先對OMP算法進行理論分析，然后對OMP算法進行改進，通過增加一個閾值來減少乘法運算次數，使運算速度更快。在矩陣分解部分采用ACD方法避免開方運算，同時在硬件實現上也進行了相應的優化。仿真結果驗證了設計的可行性。

1 OMP算法

1.1 基本OMP算法

在壓縮感知中，原始信號x的稀疏度為k，觀測矢量y是所采集的數據，y可通過測量矩陣Φ與x相乘而得。本設計的目的是在已知y和Φ的前提下恢復出x。OMP算法主要分為兩部分，即尋找稀疏矢量中非零元素的位置和計算非零元素的值。

在OMP算法中殘差r是一個很關鍵的參數，殘差是通過當前選取的列向量和原始信號的線性組合不能對壓縮測量值進行表示的部分。

1.2 改進OMP算法

令原始信號x的稀疏度為k，測量矩陣Φ大小為M×N，那么y為M維的離散信息矢量。本文提出一種新的方法，即加閾值法，通過添加一個閾值來減少乘法運算次數，閾值定為內積和的平均值的α倍，內積小于閾值的那些列在下一次迭代中不再求內積。每次迭代計算后都要對閾值進行更新。信號估計的均方誤差隨著α的增大而增大，當α為0時均方誤差最小。改進的OMP算法步驟如下：

2 計算步驟

本文利用硬件實現重構長度N=256、稀疏度k=8的原始信號，觀測矢量長度M=64。

改進后的OMP算法可分為4個模塊。第1個模塊對應重建過程的第(1)和第(2)步，也就是在剩余列的集

中尋找對殘差貢獻最大的列為最匹配原子。

第2個模塊對應重建過程的第(3)步，即計算新殘差，為下次迭代做準備。

第3個模塊對應重建過程的第(4)和第(5)步，即計算新的閾值并除去剩余列的集

中和殘差求內積小于閾值的列。求閾值前要先求內積的平均值。第t次迭代的內積平均值可用以下公式計算：

為解決對Φ的列的定位問題，用一個256位的標志位來追蹤Φ的列，標志位的第i位對應Φ的第i列。在第i列和殘差求內積后，下一個時鐘和殘差求內積的就是下一個標志位為非零所對應的列，跳過標志位為零對應的列。開始前先把標志位的每一位全部初始化成1，在每一次迭代之后對標志位進行更新。

第4個模塊對應重構過程的第(7)步，求解非零元素的值，即解決最小二乘問題。對于這類運算一般用Moore-Penrose偽逆的方法求解：

求出C的逆矩陣后，就可以求得原始信號的估計：

由于OMP算法的迭代性質，4個模塊是不能并行執行的，只能每個模塊依次執行。

3 硬件設計

硬件電路主要由以上4個模塊組成，分為兩個部分。整體硬件電路如圖1所示。

首先用觀測矢量y對殘差r進行初始化。y用寄存器組存儲，而觀測矩陣Φ用多個RAM存儲，這樣就能在一個時鐘內讀出y的所有值和Φ的一列值。數據用24位定點數表示，10位整數，14位小數。設計64個24位乘法器并行工作來求內積，然后找到內積最大值來更新

。矩陣

的大小變化從N×1～N×8。

每次迭代后會把Φ中和殘差內積小于閾值的列過濾掉，根據式(9)、(10)和(11)，剩余列的集中的每一列和殘差的內積都送到累加器進行求和，然后通過求內積平均值求得閾值。閾值參數α設置為一個常數。

256位標志位作為Φ的地址尋址，標志位每一位對應Φ每一列，初始化為所有位為1。每次迭代后對標志位進行更新，把Φ中和殘差內積小于閾值的列所對應的標志位賦為零，否則保持為1。然后在下一次迭代時跳過標志位為零所對應的Φ的列，也就是直接用下一個非零標志位所對應的列與殘差進行求內積。通過把標志位的前32位送到一個32位前導零計算器可以找出下一個非零位。

在尋找非零元素位置的部分迭代8次后，就開始計算非零元素的值。首先要計算矩陣

可通過以下等式計算：

此處復用之前的64個乘法器。C是一個對稱矩陣，所以只需要計算C的對角線上8個元素和對角線下半部（或上半部）的28個元素。

然后要對C進行交替的柯列斯基分解，矩陣分解要求出下三角矩陣L和對角矩陣D。從式(13)和(14)可以看出，L和D是相互依存的，必須以特定的順序計算。本設計中稀疏度k=8，L和D可以按照圖2箭頭所指順序計算。設計7個乘法器并行計算D中的元素，那么每計算一個元素需要一個時鐘周期。計算D-1時采用參考文獻[9]的方法進行除法運算。由于L的同一列的各個元素并不是相互依存的，所以求L的每一列值都設計為并行計算各個元素，那么每一列的計算只需要一個時鐘周期。

矩陣L的求逆需要迭代進行，如式(18)：

由于L的逆矩陣的各列的各個元素是相互依存的，所以列和列可以并行運算，每一列要按照特定的順序運算，那么計算L-1需要7個時鐘周期。

求C-1=(L-1)T×D-1×L-1時可以先求A=(L-1)T×D-1，然后再計算C-1=A×L-1。

4 仿真及結果分析

考慮到兩個模塊的最大運行頻率不一樣，本設計在尋找非零元素部分采用85 MHz的時鐘，在求解非零元素值部分采用65 MHz的時鐘。為了進行更好的對比，在MATLAB上用相同的算法、測量矩陣和觀測矢量來重構原始估計值。當α=0.25時，軟件和硬件的重構結果進行歸一化后的對比如圖3所示。

當α取值為零時，尋找非零元素部分共需要2 100個時鐘周期，而僅僅是計算內積就需要256×8=2 048個時鐘周期，計算非零元素部分共需要110個時鐘周期，總的重構時間為26.40 μs。當α取值為0.25時，計算內積所需減少到約1 300個時鐘周期，總的重構時間減少到約16.99 μs。在相同條件下，參考文獻[7]重構時間為17.61 μs。而在參考文獻[4]中，測量矩陣維數為32×128，觀測向量維數為32×1，原始信號的稀疏度為5，總的重構時間就需要24 μs。

但是改進OMP算法歸一化誤差會隨著α的增大而增大，當α取值為零時，歸一化均方誤差為0.001 5，取α=0.25時，歸一化均方誤差增加到0.007 1。

5 結論

本文采用一種閾值法，使得OMP恢復算法的求內積次數大大減少，從而縮短了信號重構所需要的時間，提高了恢復速率。同時，本文在硬件結構設計上也進行了一些優化，較好地平衡了占用資源和運算時間。本設計采用VHDL對改進的OMP算法進行了RTL級描述，在Quartus II上針對Altera 公司的Cyclone II EP2C70F672C6進行設計和仿真，結果表明信號能夠以更少的重構時間較好地恢復。

參考文獻

[1] DONOHO D L.Compressed sensing[J].Information Theory，IEEE Trans. on，2006，52(4)：1289-1306.

[2] TROPP J A，GILBERT A C.Signal recovery from random measurements via orthogonal matching pursuit[J].Information Theory，IEEE Trans.on，2007，53(12)：4655-4666.

[3] 趙貽玖.稀疏模擬信號壓縮采樣與重構算法研究[D].成都：電子科技大學，2012.

[4] SEPTINUS A，STEINBERG R.Compressive sampling hardware reconstruction[C].Circuits and Systems(ISCAS)，Proc.of 2010 IEEE International Symposium on.IEEE，2010：3316-3319.

[5] BLACHE P，RABAH H，AMIRA A.High level prototyping and FPGA implementation of the orthogonal matching pursuit algorithm[C].Information Science，Signal Processing and their Applications(ISSPA)，2012 11th International Conference on.IEEE，2012：1336-1340.

[6] STANISLAUS J L V M，MOHSENIN T.High performance compressive sensing reconstruction hardware with QRD process[C].Circuits and Systems(ISCAS)，2012 IEEE International Symposium on.IEEE，2012：29-32.

[7] STANISLAUS J，MOHSENIN T.Low-complexity fpga implementation of compressive sensing reconstruction[C].International Conference on Computing，Networking and Communications.2013.

[8] BAI L，MAECHLER P，MUEHLBERGHUBER M，et al.High-speed compressed sensing reconstruction on FPGA using OMP and AMP[C].Proc.19th Int.Conf.Electronics，Circuits and Systems(ICECS)，Dec.2012：53-56.

[9] 周殿鳳，王俊華.基于FPGA的32位除法器設計[J].信息化研究，2010(3)：26-28.

編輯：jq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

測量

測量

+關注

關注
10

文章
4849

瀏覽量
111241
稀疏信號重構

稀疏信號重構

+關注

關注
0

文章
2

瀏覽量
668

手寫圖像模板匹配算法在OpenCV中的實現

OpenCV中的模板匹配是支持基于NCC相似度查找的，但是不是很好用，一個主要的原因是查找最大閾值，只能匹配一個，自己比對閾值，又導致無法正確設定閾值范圍，所以問題很多。于是我重新寫了純Python版本的NCC圖像模板匹配的代碼

發表于 11-11 10:12 ?232次閱讀

手寫圖像模板<b class='flag-5'>匹配</b><b class='flag-5'>算法</b>在OpenCV中的<b class='flag-5'>實現</b>

基于光線追蹤的渲染算法實現

我們已經涵蓋了所有需要說的內容！我們現在準備寫我們的第一個光線追蹤器。你現在應該能夠猜到光線追蹤算法是如何工作的了。首先，注意到自然界中光的傳播只是從光源發出無數條射線，反彈直到它們撞到我們眼睛的表面。因此，光線

發表于 10-30 08:06 ?244次閱讀

基于光線<b class='flag-5'>追蹤</b>的渲染<b class='flag-5'>算法</b><b class='flag-5'>實現</b>

如何優化FPGA設計的性能

優化FPGA（現場可編程門陣列）設計的性能是一個復雜而多維的任務，涉及多個方面和步驟。以下是一些關鍵的優化策略：一、明確性能指標確定需求：首先，需要明確FPGA設計的性能指標，包

發表于 10-25 09:23 ?299次閱讀

RF匹配優化提高TRF3705性能

電子發燒友網站提供《RF匹配優化提高TRF3705性能.pdf》資料免費下載

發表于 10-18 11:09 ?0次下載

RF<b class='flag-5'>匹配</b><b class='flag-5'>優化</b>提高TRF3705性能

FPGA算法工程師、邏輯工程師、原型驗證工程師有什么區別？

邏輯工程師和 FPGA 原型驗證工程師在工作重點和職責上存在一定的區別： FPGA 算法工程師：主要關注算法的設計和優化，以在

發表于 09-23 18:26

如何用FPGA實現一個通信系統的發射端接收機？

。同步與均衡：處理信號的同步問題，并進行均衡以補償信道的失真。在實際實現中，還需要考慮以下關鍵技術和要點：時鐘管理：確保 FPGA 內部的時鐘穩定和準確，以支持高速的數據處理。資源優化：合理

發表于 09-10 19:15

優化 FPGA HLS 設計

減少錯誤并更容易調試。然而，經常出現的問題是性能權衡。在高度復雜的 FPGA 設計中實現高性能需要手動優化 RTL 代碼，而這對于HLS開發環境生成的 RTL 代碼來說是不可能的。然而，存在一些解決方案

發表于 08-16 19:56

FPGA在自動駕駛領域有哪些應用？

FPGA，分別用于傳感器數據處理、視覺算法加速和車控算法優化。FPGA通過同時支持FMC和PCI，實現

發表于 07-29 17:09

FPGA能實現什么樣的算法？

FPGA功能如此強大，請問用FPGA能實現或者比較適合實現什么樣的算法？

發表于 05-26 20:18

深度剖析FPGA實現ARM系統處理的解決方案

基于FPGA的單芯片實現方法具有低成本和快速面市等優點，是多芯片和ASICSoC非常有吸引力的替代方案

發表于 03-21 14:04 ?652次閱讀

如何對MD5加密算法優化？

有人針對程序安全啟動過程，進行MD5算法的優化嘛。目前采用標準算法，時間稍長，如果有人做過優化的話，可以分享一下，謝謝。

發表于 02-18 08:20

如何通過TC377的TIM實現軟件正交解碼？

目前項目需要實現正交解碼功能，但是GPT12用于正交解碼的引腳都沒有連接，所以只能是另辟蹊徑。目前看TC377的用戶手冊中的TIM模塊是可以（28.13.1.3 ）External capture

發表于 02-04 06:03

怎么用FPGA做算法如何在FPGA上實現最大公約數算法

FPGA算法的優點在于它們可以提供高度的定制化和靈活性，使得算法可以根據實際需求進行優化和調整。此外，FPGA還可以

發表于 01-15 16:03 ?2227次閱讀

FPGA圖像處理之CLAHE算法

在FPGA圖像處理--CLAHE算法(一)中介紹了為啥要用CLAHE算法來做圖像增強。

發表于 01-04 12:23 ?2507次閱讀

功率模塊銅線鍵合工藝參數優化設計方案

為了提高功率模塊銅線鍵合性能，采用6因素5水平的正交試驗方法，結合BP（Back Propaga‐tion）神經網絡與遺傳算法，提出了一種銅線鍵合工藝參數優化設計方案。首先，對選定樣品進行正交

發表于 01-03 09:41 ?747次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

剖析正交匹配追蹤算法的優化設計與FPGA實現

評論

手寫圖像模板匹配算法在OpenCV中的實現

基于光線追蹤的渲染算法實現

如何優化FPGA設計的性能

RF匹配優化提高TRF3705性能

FPGA算法工程師、邏輯工程師、原型驗證工程師有什么區別？

如何用FPGA實現一個通信系統的發射端接收機？

優化 FPGA HLS 設計

FPGA在自動駕駛領域有哪些應用？

FPGA能實現什么樣的算法？

深度剖析FPGA實現ARM系統處理的解決方案

如何對MD5加密算法優化？

如何通過TC377的TIM實現軟件正交解碼？

怎么用FPGA做算法如何在FPGA上實現最大公約數算法

FPGA圖像處理之CLAHE算法

功率模塊銅線鍵合工藝參數優化設計方案