1、靜止圖像壓縮編碼簡介
靜止的、不變的、稱為靜止圖像,一般從設備屏幕上看長時間保持不變。被攝事務一般是靜止或者某一特定時刻保持靜止的。按照應用場景的不同,傳輸文件、模型、圖片等靜止圖像時常用靜止圖像傳輸;現場實時監(jiān)控則常用凝固圖像傳輸。
要求如下:
①清晰度:圖像清晰度更高,從而滿足人眼對觀察圖像細節(jié)的要求,而不是利用通常電影的原理。
?、陲@示方式:逐漸浮現。即先傳模糊的整體圖像,再逐漸傳輸顯示細節(jié),從而使觀看者不用等待太久時間,適應窄帶傳輸的場景。
?、劭垢蓴_:在較長傳輸過程中,編碼方法要有較強的抗干擾噪聲能力,防止圖像呈現在終端上時質量低下。
以下為對靜態(tài)圖像編碼技術的介紹:
?、兕A測編碼:由相鄰像素間相關性出發(fā),通過前面像素值預測當前像素值,并經過實際數據的運算得到預測誤差,而該誤差通常接近實際值。因此對預測誤差直接進行單符號的熵編碼或對預測誤差進行量化再進行熵編碼是更高效率的計算方法,最主要的算法則是簡稱為DPCM的差分脈沖編碼。
?、谧儞Q編碼:是目前幾乎所有的圖像、視頻和視頻等的壓縮標準的核心編碼算法。而新近發(fā)展的更多圖像壓縮技術中,該編碼也是核心的基礎算法,在實際中得到廣泛應用。
JPEG是“Join Photographic Expert Group”的首字母簡寫,可將每24比特的單彩色像素圖像壓縮至2比特,而保持較高的圖像質量。其定義的編碼系統(tǒng)主要有以下三種:a DCT有損編碼基本系統(tǒng),大部分壓縮應用場景下均采用該系統(tǒng)。b可擴展編碼系統(tǒng):用于高壓縮、高精度、漸進重建應用。c無損系統(tǒng):應用于無失真場合。
JPEG標準一般用于自然景象、連續(xù)色調數字圖像編、解碼。
簡單歸納為:兩種工作方式(順序方式、漸進方式)、三種級別(基本系統(tǒng)、擴展系統(tǒng)、無失真系統(tǒng))。
順序方式:將圖像的行和列分割成四方小塊,從左到右、由上而下逐行逐列對所有的小塊進行編碼運算。并且解碼時也按編碼順序逐塊解碼。這兩個過程均一次完成。
漸進方式:整個圖像需要經過多次編碼運算才能完成,初次編碼時質量低于最終要求的質量。逐次編碼,質量逐次提升。解碼時首先解碼出較低質量全幅圖像,增加附加信息后再次解碼,重復若干次,最終得到滿足質量要求。解碼過程可隨時終止。
基本系統(tǒng):以離散余弦變換為核心,以順序工作為方式,用于一般精度。按照要求,每個壓縮編碼器均實現了基本算法功能。
擴展系統(tǒng):在若干方面增強并減少一些限制條件后就成為“擴展系統(tǒng)”。
無失真系統(tǒng):以DPCM技術為基礎,壓縮比較低,但是能實現壓縮時不失真。
JPEG標準是多年來圖像壓縮編碼的研究成果。雖然DCT是它的核心,但它同時也采用了DPCM、自適應量化、游程編碼、可變長熵編碼等多種技術,所以應該說是一種混合算法。
被譽為數學顯微鏡的小波變換是從傅里葉變換和加窗傅里葉變換發(fā)展而來的。小波變換引入伸縮參數,實現了時域-頻域局域化分析,從而可以對圖像的任何局部區(qū)域進行多分辨率分析。由于小波變換有高頻的方向選擇性,與人眼的視覺特性相吻合,人眼最重要的視覺特性是視覺掩蓋效應,即不變和有的區(qū)域很容易被遺忘,而對突變和極不規(guī)則變化的區(qū)域感興趣。采用嵌入式零樹小波編碼及算法,通的區(qū)域和不感興趣區(qū)域分別進行編碼,可以達到充分利用信道資源和存儲空間、提高感興趣區(qū)域的圖的。
2、視覺掩蓋效應
在大多數應用場合,最終的圖像總是由人眼來觀測的,但是人類的視覺系統(tǒng)并不完美。通過對人眼的觀察與研究發(fā)現,視覺掩蓋效應可以用于改善圖像信息的處理。
視覺選擇性與客體的特性有關,人眼對空間頻率接近于零的平滑區(qū)域和空間頻率相似紋理區(qū)域有很大的鈍性,所以不變與規(guī)則變化的場景很容易在人的意識中被遺忘,人類視覺通常只對突變和極不規(guī)則變化的區(qū)域感興趣。這種與生俱來的選擇性使視覺只限定在有限的目標上。
2.1 靜態(tài)對比靈敏度
人眼主觀上可辨別的最小亮度差別所需要的最小光強差值稱為亮度的辨別閥值。也就是說,當刺激光強I增大時,最初感覺不出,直到I變化到I+ΔI時人眼就感覺到亮度有變化了。人眼對亮度光強變化的響應是非線性的,比值ΔI/I稱為對比靈敏度。在相當寬的光強范圍內,ΔI/I保持常數為0.02,但在I很低或很高時不是常數。如果有背景,則對比靈敏度不僅與目標物的光強度I有關,而且與背景亮度I。有關。圖1給出了有背景和無背景時人眼的靜態(tài)對比靈敏度曲線。
此外,人眼的對比靈敏度還與刺激的空間變化周期(空間變化周期是指刺激的明暗不變,只改變明暗的空間間隔)有關。如果亮度固定在一定水平下,則對比靈敏度與光刺激的空間變化周期之間的關系如圖2所示。這一關系通常被稱為人眼的調制傳遞函數。圖2中還給出了等亮度的色差信號Y-R和Y-B的對比靈敏度曲線。由圖1和圖2可得到以下結論:
(1)恢復圖像的誤差如果低于對比靈敏度,則不會被人眼覺察。
(2)高頻部分在相同的靈敏度閾值下,色差信號Y-R的空間頻率只有亮度Y的一半,Y-B則為Y的1/4,通常表示色差信號所需的像素比亮度要少得多。
?。?)在相同的靈敏度閾值下,斜向柵格的空間頻率只有正常柵格的0.7,因此按斜向柵格對圖像數據采樣所需的頻率較低。
(4)高頻端的靈敏度要小于低頻端,因此對這些部分的量化誤差可大一些。
2.2 具有感興趣區(qū)域的人眼視覺特性
人們在觀察和理解圖像時常常不自覺地對其中某些區(qū)域產生興趣,把這些區(qū)域稱為視覺感興趣區(qū)域。整幅圖像的主觀視覺質量取決于感興趣區(qū)域的視覺質量,而不感興趣區(qū)域的降質常常不易被人覺察,對整幅圖像視覺質量的影響較小。例如對一副人像照片,反映一個人主要特征的是面部信息,在進行圖像壓縮時,人的面部信息與其它不重要的信息不必采用相同的壓縮比。顯然,感興趣區(qū)域的視覺特性也是一種視覺掩蓋效應。
3、 嵌入式零樹小波編碼及算法
3.1 EZW編碼
一幅圖像經過三級小波分解后形成十個子帶,如圖3所示。小波系數的分布特點是越往低頻子帶,系數值越大,包含的圖像信息越多。如圖3中的LL3子帶,越是高頻子帶,系數值越小,包含的圖像信息越小。在系數數值相同時,低頻子帶反映圖像的低頻信息,對視覺比較重要;而高頻子帶反映圖像的高頻信息,對視覺不太重要。應選擇先傳輸較低頻系數的重要比特,后傳輸較高頻系數的重要比特。正是由于小波系數具有的這些特點,它非常適合于嵌入式編碼算法。
嵌入式零樹小波編碼EZW(Embedded Zerotree Wavelet)方法是對整幅圖像進行同一級別編碼的方法,圖像中的重要區(qū)域(感興趣區(qū)域)與背景區(qū)域(非感興趣區(qū)域)具有同樣的編碼級數。EZW編碼算是一個簡單而有效的圖像編碼算法,這種算法得到的比特流中的比特按其重要性排序。使用這種算法,編碼者能夠在任一點結束編碼,允許精確到任一個目標比特率或目標失真率。
3.2EZW算法
EZW算法利用小波系數的特點較好地實現了圖像編碼的嵌入功能,為了改善小波系數重要圖的壓縮,定義了一個零數的數據結構,即一個小波系數χ。對于一個給定的門限T,如果|χ| 則稱小波系數|?是不重要的一個小波系數在一個粗尺度上,關于給定的門限是不重要的,且之后在較細的尺度上,對同樣空間位置中的所有小波系數關于給定的門限T也是不重要的,則稱小波系數形成了一個零數。這時,在粗尺度上的那個小波系母代小波系數,它是樹根,在較細尺度相應位置上的小波系數稱為了代小波系數。如果一個小波系數不重要的,但它的子代小波系數中關于門限T是重要的系數,則稱這個小波系數是孤立零。因此,小波系情況:零數根(ZTR)、孤立零。因此,小波系數有三種情況:零數根(ZTR)、孤立零(IZ)、重要系然,為了編碼的需要還可把重要系數分為正重要系數(POS)和負重要系(NEG)。
對于一個圖像的數據流,圖4給出了一個系數編碼的流程圖。
4、具有感興趣區(qū)域的靜止圖像壓縮編碼算法研究
4.1 EZW_ROI編碼算法
為了提高感興趣區(qū)域的圖像質量,在信道資源和存儲空間有限的條件下,提出感興趣區(qū)域的零樹編碼算法EZW_ROI(Embedded Zerotree Wavelet with Region of interests),它對感興趣區(qū)域圖像和背景圖像采用不同的壓縮步驟,使感興趣區(qū)域內的圖像比背景圖像具有更好的圖像質量。
對感興趣區(qū)域內外的圖像采用不同的零數小波編碼。整個編碼算法分三步進行:
?。?)確定感興趣區(qū)域:人像照片可以把感興趣區(qū)域確定為面部區(qū)域。在視頻監(jiān)視系統(tǒng)中,可以把監(jiān)視環(huán)境中的重要場景設為感興趣區(qū)域。
?。?)對低頻子帶中感興趣區(qū)域內的系數進行編碼:即對感興趣區(qū)域內的圖像進行編碼,系數采用EZW算法的零樹結構,按照EZW算法的思想進行零樹掃描和編碼。
?。?)對低頻子帶中不在感興趣區(qū)域內的系數進行編碼:即對背景區(qū)域的圖像進行編碼,系數的編碼不用EZW算法的零樹結構,只對背景區(qū)域的低頻信息進行編碼。
4.2 EZW_ROI解碼算法
對編碼圖像進行解碼時,與編碼過程相反,也分三步進行:
?。?)對低頻子帶中的感興趣區(qū)域內圖像進行與EZW算法同樣的零樹編碼。
(2)對低頻子帶中的感興趣區(qū)域外圖像進行簡單的位解碼。
(3)消除邊緣效應:在以上兩步的基礎上,對感興趣區(qū)域的四周做3%26;#215;3的均值濾波,以消除感興趣區(qū)域邊緣的影響,使得感興趣區(qū)域外的圖像在視覺上差別變弱。
5、應用實例
在研究中采用了一幅標準的8bpp的灰度人像,首先,確定感興趣區(qū)域為人像的面部,對原始圖像進行四級的小波分解,小波變換采用S+P變換;最后對圖像進行32倍壓縮,即壓縮后的比特率為0.25bpp。用EZW算法和EZW_ROI算法恢復的圖像如圖7所示。在信道資源和存儲空間有限的條件下,為了提高感興趣區(qū)域的圖像質量,采用具有感興趣區(qū)域的圖像壓縮方式,對感興趣區(qū)域背景圖像采用不同的壓縮步驟,使圖像中的重要信息盡可能少損失。試驗證明,在高壓縮比的情況下,EZW_ROI算法的重建圖像比EZW算法的重建圖像具有更好的視覺效果。
評論
查看更多