本文從技術角度對MPEG-2的視頻標準、MPEG-4 AVC/H.264和AVS視頻(GB/T 200090.2) 三個視頻標準進行對比,包括技術方案、主觀測試、客觀測試、復雜度等四個方面。
??? 一、技術對比
AVS視頻與MPEG標準都采用混合編碼框架(見圖1),包括變換、量化、熵編碼、幀內預測、幀間預測、環(huán)路濾波等技術模塊,這是當前主流的技術路線。AVS的主要創(chuàng)新在于提出了一批具體的優(yōu)化技術,在較低的復雜度下實現了與國際標準相當的技術性能,但并未使用國際標準背后的大量復雜的專利。AVS-視頻當中具有特征性的核心技術包括:8x8整數變換、量化、幀內預測、1/4精度像素插值、特殊的幀間預測運動補償、二維熵編碼、去塊效應環(huán)內濾波等。
圖 1 典型視頻編碼框架
AVS視頻編碼器框圖如下圖所示。
?
圖 2 ?AVS視頻編碼器框圖
??? AVS視頻標準定義了I幀、P幀和B幀三種不同類型的圖像,I幀中的宏塊只進行幀內預測,P幀和B幀的宏塊則需要進行幀內預測或幀間預測,圖中S0是預測模式選擇開關。預測殘差進行8?8整數變換(ICT)和量化,然后對量化系數進行zig-zag掃描(隔行編碼塊使用另一種掃描方式),得到一維排列的量化系數,最后對量化系數進行熵編碼。AVS視頻標準的變換和量化只需要加減法和移位操作,用16位精度即可完成。
??? AVS視頻標準使用環(huán)路濾波器對重建圖像濾波,一方面可以消除方塊效應,改善重建圖像的主觀質量;另一方面能夠提高編碼效率。濾波強度可以自適應調整。
AVS標準支持多種視頻業(yè)務,考慮到不同業(yè)務之間的互操作性,AVS標準定義了檔次(profile)和級別(level)。檔次是AVS定義的語法、語義及算法的子集;級別是在某一檔次下對語法元素和語法元素參數值的限定集合。為了滿足高清晰度/標準清晰度數字電視廣播、數字存儲媒體等業(yè)務的需要,AVS視頻標準定義了基準檔次(Jizhun profile)和4個級別(4.0、4.2、6.0和6.2),支持的最大圖像分辨率從720?576到1920?1080,最大比特率從10 Mbit/s到30 Mbit/s。
??? 表1? AVS與MPEG-2、MPEG-4 AVC/H.264使用的技術對比和性能差異估計
視頻編碼標準 |
MPEG-2視頻 |
MPEG-4 AVC/H.264視頻 |
AVS視頻 |
AVS視頻與AVC/H.264性能差異估計 (采用信噪比dB估算,括號內的百分比為碼率差異) |
幀內預測 |
只在頻域內進行DC系數差分預測 |
基于4×4塊,9種亮度預測模式,4種色度預測模式 |
基于8×8塊,5種亮度預測模式,4種色度預測模式 |
基本相當 |
多參考幀預測 |
只有1幀 |
最多16幀 |
最多2幀 |
都采用兩幀時相當,幀數增加性能提高不明顯 |
變塊大小運動補償 |
16×16 16×8(場編碼) |
16×16、16×8、8×16、8×8、8×4、4×8、4×4 |
16×16、16×8、8×16、8×8 |
降低約0.1dB (2-4%) |
B幀宏塊直接編碼模式 |
無 |
獨立的空域或時域預測模式,若后向參考幀中用于導出運動矢量的塊為幀內編碼時只是視其運動矢量為0,依然用于預測 |
時域空域相結合,當時域內后向參考幀中用于導出運動矢量的塊為幀內編碼時,使用空域相鄰塊的運動矢量進行預測 |
提高0.2-0.3dB (5%) |
B幀宏塊雙向預測模式 |
編碼前后兩個運動矢量 |
編碼前后兩個運動矢量 |
稱為對稱預測模式,只編碼一個前向運動矢量,后向運動矢量由前向導出 |
基本相當 |
?像素運動補償 |
僅在半像素位置進行雙線性插值 |
?像素位置采用6拍濾波,? 像素位置線性插值 |
?像素位置采用4拍濾波,?像素位置采用4拍濾波、線性插值 |
基本相當 |
變換與量化 |
8×8浮點DCT變換,除法量化 |
4×4整數變換,編解碼端都需要歸一化,量化與變換歸一化相結合,通過乘法、移位實現 |
8×8整數變換,編碼端進行變換歸一化,量化與變換歸一化相結合,通過乘法、移位實現 |
提高約0.1dB(2%) |
熵編碼 |
單一VLC表,適應性差 |
CAVLC:與周圍塊相關性高,實現較復雜 CABAC:計算較復雜 |
上下文自適應2D-VLC,編碼塊系數過程中進行多碼表切換 |
降低約0.5dB(10-15%) |
環(huán)路濾波 |
無 |
基于4×4塊邊緣進行,濾波強度分類繁多,計算復雜 |
基于8×8塊邊緣進行,簡單的濾波強度分類,濾波較少的像素,計算復雜度低 |
—— |
容錯編碼 |
簡單的條帶劃分 |
數據分割、復雜的FMO/ASO等宏塊、條帶組織機制、強制Intra塊刷新編碼、約束性幀內預測等 |
簡單的條帶劃分機制足以滿足廣播應用中的錯誤隱藏、恢復需求 |
—— |
DCT(Discrete Cosine Transform):離散余弦變換
VLC(Variable Length Coding):變長編碼
CAVLC(Context-based Adaptive Variable Length Coding):基于上下文的自適應變長碼
CABAC(Context-based Adaptive Binary Arithmetic Coding):基于上下文的自適應二進制算術編碼
FMO(Flexible Macroblock Ordering):靈活的宏塊排序
ASO(Arbitrary Slice Ordering):任意條帶排列
???二、主觀評價和客觀測試
??? 壓縮效果的評價標準有主觀評價和客觀評價兩種,各有優(yōu)缺點。主觀評判是聘請專門的評價人員來比較壓縮之后再恢復的視聽效果和原始效果的差異,通常是在專門的視聽環(huán)境中按照一定的規(guī)則進行主觀評分。客觀評判則是通過一種具體的算法來統(tǒng)計多媒體數據壓縮結果的損失,例如信噪比SNR(即信號與噪聲之比的對數)。主觀評判和客觀評判有時相差很大,因此衡量一個算法的好壞就需要在這二者之間找到一個平衡點。對一套標準的評價,通常開發(fā)過程中采用客觀評價的方法,但最終要得到主觀評價的確認。
1.MPEG-4 AVC視頻標準主觀測試
??? 2002年10-12月,MPEG 組織了專題組對AVC (ISO/IEC 14496-10 | ITU-T Rec. H.264) 與MPEG-4 Visual (ISO/IEC 14496-2)和MPEG-2 Video (ISO/IEC 13818-2)標準進行了測試。測試在FUB/ISCTI (意大利)、NIST (美國)和TUM (德國)進行,測試結果表明AVC的編碼性能有顯著提高。
??? 本次測試標準清晰度(SD)和高清晰度(HD)采用的測試條件(視頻序列和碼率)如下表:
??? 表2 AVC標清測試條件
?
?
?
??? 圖像質量主觀評價試驗依據ITU-R BT.500-11 《Methodology for the subjective assessment of the quality of television pictures(電視圖像質量主觀評價方法)》(下面可以看到AVS的兩次主觀測試同樣采用的是這個測試標準)。測試結果如下表:
??? 表4 標清情況下,AVC與優(yōu)化的MPEG(MPEG-2 HiQ)對比情況
SD |
|||||
序列 |
Football |
|
Husky |
Tempete |
|
AVC碼率 |
6 Mbps |
|
T |
|
T |
4Mbps |
1.5x |
T |
1.5x |
T |
|
3Mbps |
1.3x |
2x |
1x /1.3x |
T |
|
2.25Mbps |
> 1.3x |
2.7x |
1.3x |
T |
|
1.5Mbps |
> 1.5x |
4x |
> 1.5x |
T, 2x |
??? (注:表中T表示透明,壓縮后與原始圖像看不出差異,Nx表示被對比者碼率是AVC的N倍時才能達到同等質量,下同)
??? 由表可以看出,12個可比項中有8個的N大于等于1.5,有3個大于等于2,有一個等于4。
??? 表5標清情況下,AVC與MPEG-2參考軟件(MPEG-2 TM5)對比情況
??? 由表可以看出,AVC與MPEG-2參考軟件比,12個可比項中有9個的N大于等于1.8,有2個大于等于4。
??? 表6 高清情況下,AVC與優(yōu)化的MPEG(MPEG-2 HiQ)對比情況
HD Main (AVC Main compared MPEG-2 HiQ) |
|||||||
Sequence |
720 (60p) |
1080 (30i) |
1080 (25p) |
||||
Crew |
Harbour |
Stockholm Pan |
New Mobile & Calendar |
River Bed |
Vintage Car |
||
AVC bitrates |
20Mbps |
T |
T |
|
T |
T |
T |
10Mbps |
2x |
T |
?1x |
T, 2x |
> 1x |
T, 2x |
|
6Mbps |
1.7x |
T, 3.3x |
This bitrate was not part of the test |
> 1.7x |
1.7x |
??? 表7 高清情況下,AVC與MPEG-2參考軟件(MPEG-2 TM5)對比情況
HD Main (AVC Main compared MPEG-2 TM5) |
|||||||
Sequence |
720 (60p) |
1080 (30i) |
1080 (25p) |
||||
Crew |
Harbour |
Stockholm Pan |
New Mobile & Calendar |
River Bed |
Vintage Car |
||
AVC bitrates |
20Mbps |
T |
T |
|
T |
T |
T |
10Mbps |
2x |
T |
2x |
T, 2x |
> 1x |
T, 2x |
|
6Mbps |
1.7x |
T, 1.7x |
This bitrate was not part of the test |
> 1.7x |
1.7x |
??? 由表可以看出,AVC與MPEG-2參考軟件比,9個可比項中有8個的N大于等于1.7,有4個大于等于2。
總體上講,AVC與MPEG-2對比,85個比對中66對MPEG-2的碼率要達到1.5倍才能與AVC達到同樣質量,其中51對MPEG-2碼率要達到AVC的2倍才能達到AVC的質量。換句話說,在60%的情況下,AVC的編碼效率能夠達到MPEG-2的兩倍。
??? 鑒于AVC的編碼效率能夠達到MPEG-2的2倍,我國有關測試機構在測試AVS時,通常把AVS視頻的碼率也設在MPEG-2典型碼率的二分之一或更低,也就是測試AVS編碼效率是MPEG-2的2倍或更高的情況下的AVS視頻的編碼質量是否能夠廣播要求。
2.AVS主觀測試—— 國家廣播電視產品質量監(jiān)督檢驗中心數字電視用戶端產品測試實驗室
??? 2004年11月15日至12月26日,依據數字音視頻編解碼技術標準工作組的委托,國家廣播電視產品質量監(jiān)督檢驗中心數字電視用戶端產品測試實驗室對工作組送檢的AVS視頻編/解碼方案組織了圖像質量主觀評價試驗。通過對委托方提供的AVS軟編/解碼器的主觀評價試驗,評價AVS視頻壓縮方案的性能。
??? 圖像質量主觀評價試驗依據ITU-R BT.500-11 《Methodology for the subjective assessment of the quality of television pictures(電視圖像質量主觀評價方法)》和ITU-R BT.710-2《Subjective assessment of image quality in high-definition television(高清晰度電視圖像質量的主觀評價)》,采用雙刺激連續(xù)質量標度(DSCQS)法評價AVS視頻編/解碼系統(tǒng)處理后的圖像質量相對于未經壓縮的原始圖像質量的差別。
??? 本次視頻圖像質量主觀評價的目的是通過比較經AVS編/解碼系統(tǒng)處理過的圖像質量與原始素材圖像質量的差別來評價AVS視頻編/解碼方案的總體性能,評價素材的選擇內容應廣泛且嚴酷度適當。所選擇的測試序列應能反應圖像的亮度再現、彩色再現、靜態(tài)空間分辨率、動態(tài)空間分辨率、運動再現、視在深度效果、臨場感、閃爍性能和熟悉的色調的再現等特性。希望通過所選擇的節(jié)目能夠充分、準確地反映被評價的視頻編/解碼方案的性能。測試序列包括8個高清晰度節(jié)目和8個標準清晰度節(jié)目,每段節(jié)目時間長度為10s~20s。
??? 高清晰度圖像測試序列的被評價對象與原始素材的平均得分差在1.6和6.0之間,總平均分差為3.6,說明評價人員認為被評價對象的圖像質量與原始素材的圖像質量差別很小。
??? 統(tǒng)計結果表明, AVS視頻編/解碼方案在圖像格式為1920×1080P/25Hz、壓縮碼率為6Mbps時,被評價對象的圖像質量與原始素材圖像質量的差別很小,不易察覺。
??? 8個標準清晰度圖像測試序列的被評價對象與原始素材的平均得分差在1.1 和10.5之間,總平均分差為6.4。除序列2 外,其他7 個測試序列的標準偏差均在6.4 至8.6 之間,說明評價人員對這些測試序列打分的離散度較小。
試驗結果表明AVS 視頻編/解碼方案在圖像格式為720×576I/50Hz、壓縮碼率為2.5Mbps 時,可察覺經編/解碼處理后的被評價對象與原始素材圖像質量的差別,但差別小。
??? 本次測試表明,AVS視頻碼率不到MPEG-2典型碼率二分之一(標清)和三分之一(高清)的情況下,質量損失很小,可以達到廣播要求。
??? 3.AVS主觀測試——國家廣電總局廣播電視規(guī)劃院
??? 2005年04月至9月,國家廣電總局廣播電視規(guī)劃院受AVS工作組掛靠單位中國科學院計算技術研究所委托,對經過AVS參考軟件編解碼后的標準清晰度和高清晰度視頻進行主觀評價,評價其對源圖像的質量損傷程度,完成了《AVS視頻壓縮質量主觀評價》測試報告(附件)。
??? 本次測試的依據是廣電行業(yè)標準GY/T 134-1998《數字電視圖像質量主觀評價方法》和ITU-R BT.500-11、ITU-R BT.1210-3《Test Materials to be used in Subjective Assessment(用于主觀評價的測試材料)》標準。標清測試采用6個國際標準圖像序列,高清采用6個國家標準圖像序列。
??? 測試結果匯總如下:
?
表8? AVS主觀測試結果
測試碼率 \ 視頻類型 |
標準清晰度(625/50i) |
高清晰度(1125/50i) |
||
AVS測試碼率(Mbps) |
3 |
1.5 |
10 |
6 |
測試結果 |
優(yōu)秀 |
良好 |
優(yōu)秀 |
良好到優(yōu)秀 |
??? 考慮到目前使用MPEG-2標準實施高清電視廣播時,一般使用20Mbps的碼率,使用MPEG-2標準實施標清電視廣播時,一般使用5-6Mbps的碼率,對照本次測試結果可以得知,AVS碼率為現行MPEG-2標準的一半時,無論是標準清晰度還是高清晰度,編碼質量都達到優(yōu)秀。碼率不到其三分之一時,也達到良好到優(yōu)秀。因此相比于MPEG-2視頻編碼效率高2~3倍的前提下,AVS視頻質量已完全達到了大范圍應用所需的“良好”要求。對比MPEG標準組織對MPEG-4 AVC/H.264的測試報告,AVS在編碼效率上與其處于同等技術水平。
??? 4.AVS與MPEG標準的客觀測試
??? 對視頻編碼標準進行客觀評價的常用方法是峰值信噪比PSNR。表9、表10分別給出了AVS與MPEG-2標準以及AVS與MPEG-4 AVC/H.264標準main profile的客觀編碼性能。結果為相同碼率條件下峰值信噪比PSNR的增益。可以看出,AVS相對于MPEG-2標準編碼效率平均提高2.56dB,相比于H.264標準編碼效率略低,平均有0.11dB的損失。
表11? AVS和H.264編碼參數
|
JM 6.1e |
RM |
熵編碼 |
CABAC |
2D-VLC |
率失真優(yōu)化 |
使用 |
使用 |
參考圖像 |
2幀 |
2幀 |
B幀 |
2幀(IBBP) |
2幀(IBBP) |
隔行編碼 |
宏塊幀/場自適應 |
圖像幀/場自適應 |
運動補償塊大小 |
16′16到4′4 |
16′16到8′8 |
環(huán)路濾波 |
使用 |
使用 |
?
圖 3? City序列實驗結果
?
圖 4? Harbour序列實驗結果
?
圖 5? Spincalendar序列實驗結果
圖 6? Flamingo序列實驗結果
從上面的數據可以看出,在逐行編碼方面,AVS視頻標準的性能與H.264基本一致;在隔行編碼方面,由于AVS視頻標準目前只支持圖像級幀/場自適應編碼,平均有0.5dB的性能差距。
??? 三、復雜度對比
??? 表13對AVS與H.264的計算實現復雜性進行扼要對比,大致估算,AVS解碼復雜度相當于H.264的30%,AVS編碼復雜度相當于H.264的70%。
??? 表13? AVS與H.264計算復雜性對比
技術模塊 |
AVS視頻 |
MPEG-4 AVC/H.264視頻 |
復雜性分析 |
幀內預測 |
基于8×8塊,5種亮度預測模式,4種色度預測模式 |
基于4×4塊,9種亮度預測模式,4種色度預測模式 |
降低約50% |
多參考幀預測 |
最多2幀 |
最多16幀,復雜的緩沖區(qū)管理機制 |
存儲節(jié)省50%以上 |
變塊大小運動補償 |
16×16、16×8、8×16、8×8塊運動搜索 |
16×16、16×8、8×16、8×8、8×4、4×8、4×4塊運動搜索 |
節(jié)省30~40% |
B幀宏塊對稱模式 |
只搜索前向運動適量即可 |
雙向搜索 |
最大降低50% |
?像素運動補償 |
?像素位置采用4拍濾波 ?像素位置采用4拍濾波、線性插值 |
?像素位置采用6拍濾波 ? 像素位置線性插值 |
降低1/3存儲器的訪問量 |
變換與量化 |
解碼端歸一化在編碼端完成,降低解碼復雜性 |
編解碼端都需進行歸一化 |
解碼器低于 |
熵編碼 |
上下文自適應2D-VLC,Exp-Golomb碼降低計算及存儲復雜性 |
CAVLC:與周圍塊相關性高,實現較復雜 CABAC:硬件實現特別復雜 |
相比CABAC降低30%以上 |
環(huán)路濾波 |
基于8×8塊邊緣進行,簡單的濾波強度分類,濾波較少的像素 |
基于4×4塊邊緣進行,濾波強度分類繁多,濾波邊緣多 |
降低50% |
Interlace編碼 |
PAFF幀級幀場自適應 |
MBAFF宏塊級幀場自適應 |
降低30% |
容錯編碼 |
簡單的條帶劃分機制足以滿足廣播應用中的錯誤隱藏、恢復需求 |
數據分割、復雜的FMO/ASO等宏塊、條帶組織機制、強制Intra塊刷新編碼、約束性幀內預測等 實現特別復雜 |
大大低于 |
??? 四、小結
??? AVS視頻標準(GB/T 20090.2)是基于我國自主創(chuàng)新技術和國際公開技術所構建的標準,主要面向高清晰度和高質量數字電視廣播、網絡電視、數字存儲媒體和其他相關應用,具有以下特點:(1)性能高,編碼效率是MPEG-2的2倍以上,與H.264的編碼效率處于同一水平;(2)復雜度低,算法復雜度比H.264明顯低,軟硬件實現成本都低于H.264;(3)我國掌握主要知識產權,專利授權模式簡單,費用低。基于此,我們認為AVS標準是能夠支撐國家數字音視頻產業(yè)發(fā)展的重要標準。
??? 參考文獻
[1]?信息技術 先進音視頻編碼 第2部分:視頻. AVS N1165, 2005
[2]?黃鐵軍,高文. AVS標準制定背景與知識產權狀況. 電視技術. 2005年第7期.P4-7
[3]?Liang Fan, Siwei Ma, Feng Wu. Overview of AVS Video Standard. Proc. 2004 IEEE Intl. Conf. Multimedia & Expo., 2004: 423-426
[4]?梁凡. AVS視頻標準的技術特點. 電視技術. 2005年第7期
[5]?ISO/IEC JTC1/SC29/WG11 (MPEG). N6231 Report of The Formal Verification Tests on AVC (ISO/IEC 14496-10 | ITU-T Rec. H.264). December 2003, Waikoloa
[6]?國家廣播電視產品質量監(jiān)督檢驗中心. AVS視頻編/解碼方案圖像質量主觀評價試驗報告. 2004年12月
[7]?國家廣播電影電視總局廣播電視規(guī)劃院. AVS視頻壓縮質量主觀評價(AVS參考軟件5.2版)測試報告. 2005年9月
評論
查看更多