在制定數字音視頻壓縮編碼標準的過程中,聯合圖像專家組(Joint Photographic Experts Group, JPEG)、動態圖像專家組(Moving Pictures Experts Group, MPEG)和視頻編碼專家組(Video Coding ExpertGroup, VCEG)發揮了至關重要的推動作用。下面介紹下數字音視頻壓縮編碼都有哪些標準。
1、MJPEG和MJPEG2000系列
JPEG是在國際標準化組織(International Organization for Standardization, ISO)和國際電話電報咨詢委員會(Consultation Committee of the International Telephone and Telegraph,CCITT)內運作的一個工作組。在視頻壓縮方面,JPEG先后編制了MJPEG和MJPEG2000。MJPEG是在JPEG基礎發展起來的動態圖像壓縮技術,它只單獨地對某一幀進行壓縮。而基本不考慮視頻流中不同幀之間的變化。使用該技術可獲取清晰度很高的視頻圖像,而且可靈活設置每路的視頻清晰度和壓縮幀數。其壓縮后的畫面還可被任意剪接。同樣格式的MJPEG視頻壓縮不同于幀間壓縮,因為壓縮比特率比較低,所以編碼與解碼相對比較容易,并不需要過多的運算能力,也使得軟件或者芯片可以十分容易地對MJPEG進行編輯。正因為此,一些移動設備,如數碼相機使用MJPEG來進行短片的編碼。但其缺陷也非常明顯:其一,丟幀現象嚴重、實時性差,在保證每路都必須是高清晰的前提下,很難完成實時壓縮;其二,壓縮效率低,占用存儲空間較大。
MJPEG 2000是JPEG 2000標準中的第三部分,它是在標準中第一部分的基礎上對運動圖像進行編解碼的壓縮標準。MJPEG 2000是一種針對圖像序列的標準,在一個單獨編解碼器中同時支持無損和有損壓縮。它允許一個或多個JPEG 2000壓縮圖像序列與聲音、元數據同步后,存儲為MJ2的文件格式。
2.MPEG系列
MPEG-1是MPEG制定的第一個視頻和音頻有損壓縮標準,也是最早推出及應用在市場上的MPEG技術,其原來的主要目標是在CD光盤上記錄影像,后來被廣泛應用在VCD光盤中。1992年年底,MPEG-1正式被批準成為國際標準。MPEG-1可針對標準圖像格式(Standard Image Format,SIF)的標準分辨率(對于NTSC制式為352x240;對于PAL制式為352x288)的圖像進行壓縮,傳輸速率為1.5Mb/s,每秒播放30幀,具有CD音質,質量級別基本與家用錄像系統(Video Home System,VHS)相當。MPEG-1的編碼速率最高可達4~5Mb/s,但隨著速率的提高,其解碼后的圖像質量有所降低。
MPEG-2制定于1994年,其設計目標是提供高級工業標準的圖像以及更高的傳輸率。它是為HDTV和DVD等制定的3~10Mb/s的運動圖像及其伴音的編碼標準。MPEG-2技術的主要特點包括:同時支持隔行掃描輸入和逐行掃描輸入;提供一個較廣的范圍改變壓縮比,以適應不同畫面質量、存儲容量以及帶寬的要求。MPEG-2根據視頻編碼技術的復雜度,將各類應用劃分為不同的檔次(profile)和級別(level),檔次和級別的概念解決了比特流的可交換性和國際性。MPEG-2增加了可分級編碼特性,允許從一個編碼數據流中得到不同質量等級或不同時空分辨率的視頻信號。
MPEG-4于2000年年初正式成為國際標準。MPEG-4的設計目標就是提供低比特率下的多媒體通信。MPEG-4與之前的標準相比更適于交互AVS服務以及遠程監控,更加注重多媒體系統的交互性和靈活性。MPEG-4的壓縮方法可以根據應用需求選取合適的算法進行系統裁剪。
MPEG-7設計的目的就是解決海量的圖像和聲音信息與快速檢索之間的矛盾。MPEG-7被稱為多媒體內容描述接口,其目標就是產生一種描述多媒體內容數據的標準,滿足實時、非實時以及推拉應用的需求。MPEG-7擴展了現有標識內容的專用方案及相關功能,包含了更多的多媒體數據類型。
MPEG-21設計的目標是將不同的協議、標準和技術等有機地融合在一起,同時制定新的標準。MPEG-21致力于為多媒體傳輸和使用定義一個標準化的、可互操作的和高度自動化的開放框架。MPEG-21的基本框架要素包括數字項目的識別和描述、內容表示、數字項目說明、內容管理與使用、知識產權管理和保護、終端、網絡和事件報告等部分。
3.H.26x系列
H.261是VCEG制定的一個視頻編碼標準,屬于視頻編解碼器部分。H.261是第一個實用的數字視頻編碼標準。其設計的目的是在帶寬為64Kb/s的綜合業務數字網上傳輸質量可靠的視頻信號。H.261使用了混合編碼框架。H.261僅對與兼容性有關的碼元語法、碼元復用、解碼過程等做了嚴格的限制性規定,而對復原圖像質量指標有重要影響但不影響兼容性的部分未做限制性規定,給開發者、廠商和用戶提供了很大的應用空間。
H.263是VC++EG的一個標準草案,是為低碼流通信而設計的。它提供了4種可選的編碼算法:無限制的運動矢量模式、先進預測模式、PB幀模式和基于語義的算術預測模式。H.263+是H.263的第二個版本。H.263+提供了12個新的可協商模式和其他功能,如高級幀內編碼、去塊效應濾波、參考幀選擇、SNR/時域/空域可分級性等,進一步提高了壓縮編碼性能。H.263+允許使用更多的源格式,對于圖像時鐘頻率也有多種選擇,拓寬了應用范圍;另-重要的改進是可擴展性,它允許多設置速率及多分辨率,增強了視頻信息在易誤碼、易包異構網絡環境下的傳輸,并且還允許在碼流內加入許多附加的信息,大大方便了用戶的操作。H.263C++是H.263的第三版本,H.263C++在視頻流的抗誤碼方面增加了不少功能,增加了可逆VLC編碼和基于數據分類的抗誤碼組合,同時擴展了參考幀選擇模式;增強了抗誤碼系統的健壯性。
H.26L設計目的是對多種圖像信源實現低比特率、實時和低延遲的視頻編碼。H.26L是H.264的雛形。H.264同時也是MPEG-4中的第十部分。H.264作為新一代視頻壓縮算法,吸收了以往各種編碼方案特別是MPEG-2和H.263C++的優點,并在語法結構、編碼預測算法、數據變換輸出方式等方面進行了很多改進,其性能得到了很大的提高。其編解碼流程主要包括5個部分:幀間和幀內預測、變換和反交換、量化和反量化、環路濾波、熵編碼。H.264具有低碼流、高質量的圖像、容錯能力強、網絡適應性強等特點。
作為新一代視頻編碼標準,HEVC(H.265)仍然屬于 "預測加變換"的混合編碼框架。然而,相對于H.264, H.265 在很多方面有了革命性的變化。
靈活的編碼結構
在H.265中,將宏塊的大小從H.264的16X16擴展到了64X64,以便于對高分辨率視頻格式的壓縮。同時,采用了更加靈活的編碼結構來提高編碼效率,包括編碼單元、預測單元何變換單元。
靈活的塊結構—RQT
RQT(Residual Quad-tree Transform)是一種自適應的變換技術,這種思想是對H.264/AVC中ABT(Adaptive Block-size Transform)技術的延伸和擴展。對于幀間編碼來說,它允許變換塊的大小根據運動補償塊的大小進行自適應的調整;對于幀內編碼來說,它允許變換塊的大小根據幀內預測殘差的特性進行自適應地調整。
大塊的變換相對于小塊的變換,一方面能夠提供更好的能量集中效果,并能在量化后保存更多的圖像細節,但是另一方面在量化后卻會帶來更多的振鈴效應。 因此,根據當前塊信號的特性,自適應地選擇變換塊大小。
采樣點自適應偏移
SAO(Sample Adaptive Offset)在編解碼環路內,位于Deblock 之后,通過對重建圖像的分類,對每一類圖像像素值加減一個偏移, 達到減少失真的目的,從而提高壓縮率、減少碼流。采用SAO后,平均可以減少2%~6%的碼流,而編碼器和解碼器的性能消耗僅增加了約2%。
自適應環路濾波
ALF(Adaptive Loop Filter)在編解碼環路內,位于Deblock和SAO之后,用于恢復重建圖像以達到重建圖像與原始圖像之間的均方差(MSE)最小。ALF 的系數是在幀級計算和傳輸的,可以整幀應用ALF,也可以對于基于塊或基于量化樹(Quadtree)的部分區域進行ALF,如果是基于部分區域的ALF,還必須傳遞指示區域信息的附加信息。
并行化設計
當前芯片架構已經從單核性能逐漸往多核并行方向發展,因此為了適應并行化程度非常高的芯片實現,HEVC/H265引入了很多并行運算的優化思路,克服了H.264的缺陷。
lw
評論
查看更多