視頻基礎
視頻系統術語
目前,國內外各個視頻會議生產廠家都陸續推出了自己的各種高清或超清產品,都在不遺余力的宣傳圖像分辨率。但是,要達到高清/超清的視頻會議,單單有720p或者1080p的圖像分辨率是不夠的。視頻會議作為多媒體的一種應用,整個系統涉及到前端視頻采集、圖像的編碼能力、高質量的網絡傳輸、高清晰的視頻顯示設備。另外,如果我們在觀看高清晰視頻圖像的時候,不能得到一個更清晰、連續的音頻效果,那么這個過程實際上就沒有任何意義,所以高質量音頻的重要性完全不亞于視頻。所以在高清或者超清的視頻會議中有幾個關鍵的知識點需要了解:高清的視頻分辨率、高清視頻顯示設備的接口、高質量的音頻傳輸接口、高質量的音頻。技術的發展都是循序漸進的過程,在本文檔中不但列出了高清視頻的相關術語,還把非高清視頻系統中的相關術語也一并列出,這樣會有一個很直觀的比較過程。
1???????? 視頻接口
我們經常在家里的電視機、各種播放器上,視頻會議產品和監控產品的編解碼器的視頻輸入/輸出接口上看到很多視頻接口,這些視頻接口哪些是模擬接口、哪些是數字接口,哪些接口可以傳輸高清圖像等,下面就做一個詳細的介紹。
目前最基本的視頻接口是復合視頻接口、S-vidio接口;另外常見的還有色差接口、VGA接口、DVI接口、HDMI接口、SDI接口。
1.1????? 復合視頻接口
1.1.1?????? 接口圖
???????
1.1.2?????? 說明
復合視頻接口也叫AV接口或者Video接口,是目前最普遍的一種視頻接口,幾乎所有的電視機、影碟機類產品都有這個接口。
它是音頻、視頻分離的視頻接口,一般由三個獨立的RCA插頭(又叫梅花接口、RCA接口)組成的,其中的V接口連接混合視頻信號,為黃色插口;L接口連接左聲道聲音信號,為白色插口;R接口連接右聲道聲音信號,為紅色插口。
1.1.3?????? 評價
它是一種混合視頻信號,沒有經過RF射頻信號調制、放大、檢波、解調等過程,信號保真度相對較好。圖像品質影響受使用的線材影響大,分辨率一般可達350-450線,不過由于它是模擬接口,用于數字顯示設備時,需要一個模擬信號轉數字信號的過程,會損失不少信噪比,所以一般數字顯示設備不建議使用。
1.2????? S-Video接口
1.2.1?????? 接口圖
???????????? ?????????
1.2.2?????? 說明
S接口也是非常常見的接口,其全稱是Separate Video,也稱為SUPER VIDEO。S-Video連接規格是由日本人開發的一種規格,S指的是“SEPARATE(分離)”,它將亮度和色度分離輸出,避免了混合視訊訊號輸出時亮度和色度的相互干擾。S接口實際上是一種五芯接口,由兩路視亮度信號、兩路視頻色度信號和一路公共屏蔽地線共五條芯線組成。
?
1.2.3?????? 評價
同AV 接口相比,由于它不再進行Y/C混合傳輸,因此也就無需再進行亮色分離和解碼工作,而且使用各自獨立的傳輸通道在很大程度上避免了視頻設備內信號串擾而產生的圖像失真,極大地提高了圖像的清晰度。但S-Video 仍要將兩路色差信號(Cr Cb)混合為一路色度信號C,進行傳輸然后再在顯示設備內解碼為Cb和Cr進行處理,這樣多少仍會帶來一定信號損失而產生失真(這種失真很小但在嚴格的廣播級視頻設備下進行測試時仍能發現) 。而且由于Cr Cb的混合導致色度信號的帶寬也有一定的限制,所以S-Video雖然已經比較優秀,但離完美還相去甚遠。S-Video雖不是最好的,但考慮到目前的市場狀況和綜合成本等其它因素,它還是應用最普遍的視頻接口之一。
1.3????? YPbPr /YCbCr色差接口
1.3.1?????? 接口圖
???????????
1.3.2?????? 說明
色差接口是在S接口的基礎上,把色度(C)信號里的藍色差(b)、紅色差(r)分開發送,其分辨率可達到600線以上。它通常采用YPbPr 和YCbCr兩種標識,前者表示逐行掃描色差輸出,后者表示隔行掃描色差輸出。現在很多電視類產品都是靠色差輸入來提高輸入訊號品質,而且透過色差接口,可以輸入多種等級訊號,從最基本的480i到倍頻掃描的480p,甚至720p、1080i等等,都是要通過色差輸入才有辦法將信號傳送到電視當中。
1.3.3?????? 評價
由電視信號關系可知,我們只需知道Y、Cr、Cb的值就能夠得到G(綠色)的值,所以在視頻輸出和顏色處理過程中就統一忽略綠色差Cg而只保留Y Cr Cb,這便是色差輸出的基本定義。作為S-Video的進階產品,色差輸出將S-Video傳輸的色度信號C分解為色差Cr和Cb,這樣就避免了兩路色差混合譯碼并再次分離的過程,也保持了色度信道的最大帶寬,只需要經過反矩陣譯碼電路就可以還原為RGB三原色信號而成像,這就最大限度地縮短了視頻源到顯示器成像之間的視頻信號信道,避免了因繁瑣的傳輸過程所帶來的影像失真,所以色差輸出的接口方式是目前最好模擬視頻輸出接口之一。
1.4????? VGA接口
1.4.1?????? 接口圖
????????????????????
1.4.2?????? 說明
VGA接口也叫D-Sub接口。VGA接口是一種D型接口,上面共有15針,分成三排,每排五個。VGA接口是顯卡上應用最為廣泛的接口類型,絕大多數的顯卡都帶有此種接口。迷你音響或者家庭影院擁有VGA接口就可以方便的和計算機的顯示器連接,用計算機的顯示器顯示圖像。
1.4.3?????? 評價
VGA接口傳輸的仍然是模擬信號,對于以數字方式生成的顯示圖像信息,通過數字/模擬轉換器轉變為R、G、B三原色信號和行、場同步信號,信號通過電纜傳輸到顯示設備中。對于模擬顯示設備,如模擬CRT顯示器,信號被直接送到相應的處理電路,驅動控制顯像管生成圖像。而對于LCD、DLP等數字顯示設備,顯示設備中需配置相應的A/D(模擬/數字)轉換器,將模擬信號轉變為數字信號。在經過D/A和A/D二次轉換后,不可避免地造成了一些圖像細節的損失。VGA接口應用于CRT顯示器無可厚非,但用于數字電視之類的顯示設備,則轉換過程的圖像損失會使顯示效果略微下降。
1.5????? DVI接口
1.5.1?????? 接口圖
目前的DVI接口分為兩種:
??????????????
一個是DVI-D接口,只能接收數字信號,接口上只有3排8列共24個針腳,其中右上角的一個針腳為空。不兼容模擬信號。
?????????????????
另外一種則是DVI-I接口,可同時兼容模擬和數字信號。兼容模擬幸好并不意味著模擬信號的接口D-Sub接口可以連接在DVI-I接口上,而是必須通過一個轉換接頭才能使用,一般采用這種接口的顯卡都會帶有相關的轉換接頭。
1.5.2?????? 說明
DVI全稱為Digital Visual Interface,它是1999年由Silicon Image、Intel(英特爾)、Compaq(康柏)、IBM、HP(惠普)、NEC、Fujitsu(富士通)等公司共同組成DDWG(Digital Display Working Group,數字顯示工作組)推出的接口標準。它是以Silicon Image公司的PanalLink接口技術為基礎,基于TMDS(Transition Minimized Differential Signaling,最小化傳輸差分信號)電子協議作為基本電氣連接。TMDS是一種微分信號機制,可以將象素數據編碼,并通過串行連接傳遞。顯卡產生的數字信號由發送器按照TMDS協議編碼后通過TMDS通道發送給接收器,經過解碼送給數字顯示設備。一個DVI顯示系統包括一個傳送器和一個接收器。傳送器是信號的來源,可以內建在顯卡芯片中,也可以以附加芯片的形式出現在顯卡PCB上;而接收器則是顯示器上的一塊電路,它可以接受數字信號,將其解碼并傳遞到數字顯示電路中,通過這兩者,顯卡發出的信號成為顯示器上的圖象。
1.5.3?????? 評價
顯示設備采用DVI接口具有主要有以下兩大優點:
1、速度快
DVI傳輸的是數字信號,數字圖像信息不需經過任何轉換,就會直接被傳送到顯示設備上,因此減少了數字→模擬→數字繁瑣的轉換過程,大大節省了時間,因此它的速度更快,有效消除拖影現象,而且使用DVI進行數據傳輸,信號沒有衰減,色彩更純凈,更逼真。
2、畫面清晰
計算機內部傳輸的是二進制的數字信號,使用VGA接口連接液晶顯示器的話就需要先把信號通過顯卡中的D/A(數字/模擬)轉換器轉變為R、G、B三原色信號和行、場同步信號,這些信號通過模擬信號線傳輸到液晶內部還需要相應的A/D(模擬/數字)轉換器將模擬信號再一次轉變成數字信號才能在液晶上顯示出圖像來。在上述的D/A、A/D轉換和信號傳輸過程中不可避免會出現信號的損失和受到干擾,導致圖像出現失真甚至顯示錯誤,而DVI接口無需進行這些轉換,避免了信號的損失,使圖像的清晰度和細節表現力都得到了大大提高。
1.6????? SDI接口
1.6.1?????? 接口圖
??????????????????
1.6.2?????? 說明
SDI接口是“數字分量串行接口”。
串行接口是把數據的各個比特以及相應的數據通過單一通道順序傳送的接口。由于串行數字信號的數據率很高,在傳送前必須經過處理。用擾碼的不歸零倒置(NRZI)來代替早期的分組編碼,其標準為SMPTE-259M和EBU-Tech-3267,標準包括了含數字音頻在內的數字復合和數字分量信號。在傳送前,對原始數據流進行擾頻,并變換為NRZI碼,確保在接收端可靠地恢復原始數據。這樣在概念上可以將數字串行接口理解為一種基帶信號調制。SDI接口能通過270Mb/s的串行數字分量信號,對于16:9格式圖像,應能傳送360Mb/s的信號。
1.6.3?????? 評價
SDI接口不能直接傳送壓縮數字信號,數字錄像機、硬盤等設備記錄的壓縮信號重放后,必須經解壓并經SDI接口輸出才能進入SDI系統。如果反復解壓和壓縮,必將引起圖像質量下降和延時增加,為此各種不同格式的數字錄像機和非線性編輯系統,規定了自己的用于直接傳輸壓縮數字信號的接口。(a)索尼公司的串行數字數據接口SDDI(SerialDigital Data Interface),用于Betacam-SX非線性編輯或數字新聞傳輸系統,通過這種接口,可以4倍速從磁帶上載到磁盤。 (b)索尼公司的4倍速串行數字接口QSDI(QuarterSerial Digital Interface),在DVCAM錄像機編輯系統中,通過該接口以4倍速從磁帶上載到磁盤、從磁盤下載到磁帶或在盤與盤之間進行數據拷貝。 (c)松下公司的壓縮串行數字接口CSDI(CompressionSerial Digital Interface),用于DVCPRO和Digital-S數字錄像機、非線性編輯系統中,由帶基到盤基或盤基之間可以4倍速傳輸數據。
以上三種接口互不兼容,但都與SDI接口兼容。在270Mb/s的SDI系統中,可進行高速傳輸。這三種接口是為建立數字音視頻網絡而設計的,這類網絡不象計算機網絡那樣使用握手協議,而使用同步網絡技術,不會因路徑不同而出現延時。
人們常在SDI信號中嵌入數字音頻信號,也就是將數字音頻信號插入到視頻信號的行、場同步脈沖(行、場消隱)期間與數字分量視頻信號同時傳輸。
1.7????? HDMI接口
1.7.1?????? 接口圖
1.7.2?????? 說明
HDMI的英文全稱是“High? Definition Multimedia”,中文的意思是高清晰度多媒體接口。HDMI接口可以提供高達5Gbps的數據傳輸帶寬,可以傳送無壓縮的音頻信號及高分辨率視頻信號。同時無需在信號傳送前進行數/模或者模/數轉換,可以保證最高質量的影音信號傳送。應用HDMI的好處是:只需要一條HDMI線,便可以同時傳送影音信號,而不像現在需要多條線材來連接;同時,由于無線進行數/模或者模/數轉換,能取得更高的音頻和視頻傳輸質量。對消費者而言,HDMI技術不僅能提供清晰的畫質,而且由于音頻/視頻采用同一電纜 ,大大簡化了家庭影院系統的安裝。
?
1.7.3?????? 評價
2002年的4月,日立、松下、飛利浦、Silicon Image、索尼、湯姆遜、東芝共7家公司成立了HDMI組織開始制定新的專用于數字視頻/音頻傳輸標準。2002年歲末,高清晰數字多媒體接口(High-definition Digital Multimedia Interface)HDMI 1.0標準頒布。與DVI相比,HDMI可以傳輸數字音頻信號,并增加了對HDCP的支持,同時提供了更好的DDC可選功能。HDMI支持5Gbps的數據傳輸率,最遠可傳輸15米,足以應付一個1080p的視頻和一個8聲道的音頻信號。而因為一個1080p的視頻和一個8聲道的音頻信號需求少于4GB/s,因此HDMI還有很大余量。這允許它可以用一個電纜分別連接DVD播放器,接收器和PRR。此外HDMI支持EDID、DDC2B,因此具有HDMI的設備具有“即插即用”的特點,信號源和顯示設備之間會自動進行“協商”,自動選擇最合適的視頻/音頻格式。
HDMI在針腳上和DVI兼容,只是采用了不同的封裝:
HDMI to DVI-D轉接頭:
HDMI to DVI-D轉接線:
1.8????? IEEE1394接口
1.8.1?????? 接口圖
?????????????????
1.8.2?????? 說明
IEEE 1394也稱為火線或iLink,它能夠傳輸數字視頻和音頻及機器控制信號,具有較高的帶寬,且十分穩定。通常它主要用來連接數碼攝像機、DVD錄像機等設備。IEEE 1394接口有兩種類型:6針的六角形接口和4針的小型四角形接口。6針的六角形接口可向所連接的設備供電,而4針的四角形接口則不能。
1.8.3?????? 評價
它的設計初衷是成為電子設備(包括便攜式攝像機、個人電腦、數字電視機、音/視頻接收器、DVD播放機、打印機等)之間的一個通用連接接口。1394電纜可以傳輸不同類型的數字信號,包括視頻、音頻、數碼音響、設備控制命令和計算機數據。IEEE 1394主要的性能特點如下:
數字接口:數據能夠以數字形式傳輸,不需要模數轉換,從而降低了設備的復雜性,保證了信號的質量。
熱插拔:即系統在全速工作時,IEEE 1394設備也可以插入或拆除,用戶會發現,增添一個1394器件,就像將電源線插入其電氣插座中一樣容易。
1.9????? BNC接口
1.9.1?????? 接口圖
?????????????????
1.9.2?????? 說明
BNC接口是指同軸電纜接口,BNC接口用于75歐同軸電纜連接用,提供收(RX)、發(TX)兩個通道,它用于非平衡信號的連接。
?
1.9.3?????? 評價
BNC(同軸電纜卡環形接口)接口主要用于連接高端家庭影院產品以及專業視頻設備。BNC電纜有5個連接頭,分別接收紅、綠、藍、水平同步和垂直同步信號。BNC接頭可以讓視頻信號互相間干擾減少,可達到最佳信號響應效果。此外,由于BNC接口的特殊設計,連接非常緊,不必擔心接口松動而產生接觸不良。
2???????? 音頻接口
除了高清視頻帶來的視覺上的沖擊,音頻方面質量也有很大提高,能給大家帶來更逼真的現場效果。對于目前經常提到的音頻接口做一個說明。
2.1????? RCA模擬音頻
RCA接頭就是常說的蓮花頭,利用RCA線纜傳輸模擬信號是目前最普遍的音頻連接方式。每一根RCA線纜負責傳輸一個聲道的音頻信號,所以立體聲信號,需要使用一對線纜。對于多聲道系統,就要根據實際的聲道數量配以相同數量的線纜。立體聲RCA音頻接口,一般將右聲道用紅色標注,左聲道則用藍色或者白色標注。
2.2????? 平衡模擬音頻
大三芯插頭
?
XLR接口
與RCA模擬音頻線纜直接傳輸聲音的方式完全不同,平衡模擬音頻(Balanced Analog Audio)接口使用兩個通道分別傳送信號相同而相位相反的信號。接收端設備將這兩組信號相減,干擾信號就被抵消掉,從而獲得高質量的模擬信號。平衡模擬音頻通常采用XLR接口和大三芯接口。XLR俗稱卡儂頭,有三針插頭和鎖定裝置組成。由于采用了鎖定裝置,XLR連接相當牢靠。大三芯接口則采用直徑為6.35毫米的插頭,其優點是耐磨損,適合反復插拔。平衡模擬音頻連接主要出現在高級模擬音響器材或專業音頻設備上。
?
2.3????? S/PDIF
S/PDIF(Sony/Philips Digital Interface,索尼和飛利浦數字接口)是由SONY公司與PHILIPS公司聯合制定的一種數字音頻輸出接口。該接口廣泛應用在CD播放機、聲卡及家用電器等設備上,能改善CD的音質,給我們更純正的聽覺效果。該接口傳輸的是數字信號,所以不會像模擬信號那樣受到干擾而降低音頻質量。需要注意的是,S/PDIF接口是一種標準,同軸數字接口和光線接口都屬于S/PDIF接口的范疇。
2.4????? 數字同軸
數字同軸(Digital Coaxial)是利用S/PDIF接口輸出數字音頻的接口。同軸線纜有兩個同心導體,導體和屏蔽層共用同一軸心。同軸線纜是由絕緣材料隔離的銅線導體,阻抗為75歐姆,在里層絕緣材料的外部是另一層環形導體及其絕緣體,整個電纜由聚氯乙烯或特氟綸材料的護套包住。同軸電纜的優點是阻抗穩定,傳輸帶寬高,保證了音頻的質量。雖然同軸數字線纜的標準接頭為BNC接頭,但市面上的同軸數字線材多采用RCA接頭。
2.5????? 光纖
光纖(Optical)以光脈沖的形式來傳輸數字信號,其材質以玻璃或有機玻璃為主。光纖同樣采用S/PDIF接口輸出,其是帶寬高,信號衰減小,常常用于連接DVD播放器和AV功放,支持PCM數字音頻信號、Dolby以及DTS音頻信號。
2.6????? 鳳凰頭
鳳凰頭也經常被用來作為音頻的輸入和輸出端口。
3???????? 視頻分辨率
3.1????? CIF
CIF是常用的標準化圖像格式(Common Intermediate Format)。在H.323協議簇中,規定了視頻采集設備的標準采集分辨率。CIF = 352×288像素。
CIF格式具有如下特性:
(1) 電視圖像的空間分辨率為家用錄像系統(Video Home System,VHS)的分辨率,即352×288。
(2) 使用非隔行掃描。
(3) 使用NTSC幀速率,30幅/秒。
(4) 使用1/2的PAL水平分辨率,即288線。
(5) 對亮度和兩個色差信號(Y、Cb和Cr)分量分別進行編碼,它們的取值范圍同ITU-R BT.601。即黑色=16,白色=235,色差的最大值等于240,最小值等于16。
??? 下面為5種CIF 圖像格式的參數說明。
sub-QCIF 128×96
QCIF?????????????????????????? 176×144
CIF???????????????????????????????????? 352×288
4CIF??????????????????????????? 704×576
9CIF??????????????????????????? 1056×864??
16CIF????????????????????????? 1408×1152
目前在視頻會議行業中使用CIF、4CIF,而在監控行業中使用CIF、HALF D1、D1等幾種分辨率。
3.2????? DCIF
在視頻監控中,經過研究發現一種更為有效的監控視頻編碼分辨率(DCIF),其像素為528×384。DCIF分辨率的是視頻圖像來歷是將奇、偶兩個HALF D1,經反隔行變換,組成一個D1(720*576),D1作邊界處理,變成4CIF(704×576),4CIF經水平3/4縮小、垂直2/3縮小,轉換成528×384。528×384的像素數正好是CIF像素數的兩倍,為了與常說的2CIF(704*288)區分,我們稱之為DOUBLE CIF,簡稱DCIF。顯然,DCIF在水平和垂直兩個方向上,比Half D1更加均衡。
3.3????? Dx系列/720p/1080p
Dx系列是數字電視系統顯示格式的標準,共分為如下五種規格。我們經常說的高清視頻、超高清視頻的720p和1080p也是數字電視系統的顯示格式。
D1:480i格式(525i):720×480(水平480線,隔行掃描),和NTSC模擬電視清晰度相同,行頻為15.25kHz,相當于我們所說的4CIF(720×576)。
D2:480p格式(525p):720×480(水平480線,逐行掃描),較D1隔行掃描要清晰不少,和逐行掃描DVD規格相同,行頻為31.5kHz。
D3:1080i格式(1125i):1920×1080(水平1080線,隔行掃描),高清采用最多的一種分辨率,分辨率為1920×1080i/60HZ,行頻為33.75kHz。
D4:720p格式(750p):1280×720(水平720線,逐行掃描),雖然分辨率較D3要低,但是因為逐行掃描,市面上更多人感覺相對于1080i(實際逐次540線)視覺效果更加清晰。在最大分辨率達到1920×1080的情況下,D3要比D4感覺更加清晰,尤其是文字表現力上,分辨率為1280×720p/60HZ,行頻為45kHz。
D5:1080p格式(1125p):1920×1080(水平1080線,逐行掃描),目前民用高清視頻的最高標準,分辨率為1920×1080p/60HZ,行頻為67.5KHZ。
其中D1 和D2標準是我們一般模擬電視的最高標準,并不能稱的上高清晰,D3的1080i標準是高清晰電視的基本標準,它可以兼容720p格式,而D5的1080p只是專業上的標準,并不是民用級別的,上面所給出的60HZ只是理想狀態下的場頻,而它的行頻為67.5KHZ,目前還沒有如此高行頻的電視問世,實際在專業領域里1080p的場頻只有24HZ,25HZ和30HZ。
??? 需要指出的一點是,DVI接口是日本獨有的特殊接口,國內電視幾乎沒有帶這種接口的,最多的是色差接口,而色差接口最多支持到D4,理論上肯定沒有HDMI(純數字信號,支持到1080p)的最高清晰度高,但在1920×1080以下分辨率的電視機上,一般也沒有很大差別。
4???????? 音頻技術
視頻通訊過程是視頻和音頻的實時雙向完整通訊過程。在這個過程中我們為了獲得高清晰視頻圖像,有時卻忽略了另外一個重要的過程——音頻通訊過程。如果我們在觀看高清晰視頻圖像的時候,不能得到一個更清晰、連續的音頻效果。那么這個過程實際上就沒有任何意義,所以其重要性甚至超過視頻。在傳統的視頻會議系統中音頻技術發展極其緩慢,原因在于目前應用于視頻通訊的音頻編解碼壓縮標準都是為了保持傳輸時的低帶寬占用和較高的編解碼效率,從而將音頻信號的采樣頻率、采樣精度和采樣范圍指標做了極大的降低,使得所能提供的音頻清晰度和還原性都有很大程度上的衰減。與用于存儲和回放非實時壓縮協議的標準(如OGG、MP3等)相比,音頻的保真度非常低。這樣就在某種程度上對現場聲音的還原達不到要求。目前傳統視頻通訊過程中主要采用的是G.711、G.722、G.722.1、G.728等音頻標準,音頻寬度僅有50Hz-7KHz單聲道,而人耳所能感知的自然界的頻響能力可以達到20Hz-20KHz,因此,在對現場環境音的還原過程中過多的音頻信息的丟失造成了無法真實表現現場情況。所以在高清晰視頻通訊過程中我們勢必要有一種相輔助的音頻處理方式解決此問題。使整個高清晰通訊過程更去近于完美。
目前國際上對音頻處理技術上標準較多,在對下一代實時交互音頻處理上可以采用MPEG-1 Layer 2或AAC系列音頻,對選用標準的原則是,音頻頻響范圍要達到22KHz,這樣就幾乎可以覆蓋了人耳聽覺的全部范圍,甚至在高頻方面還有所超越,能夠使現場音頻得到真實自然的還原,并且在還原時可以采用雙聲道立體聲回放,使整個視頻通訊的聲音有更強的臨近感,達到CD級音質。同時在對鏈路帶寬的適應和編解碼效率上達到最佳。下面是各種音頻編碼標準的說明:
4.1????? G.711
類型:Audio
制定者:ITU-T
所需頻寬:64Kbps
特性:算法復雜度小,音質一般
優點:算法復雜度低,壓縮比小(CD音質>400kbps),編解碼延時最短(相對其它技術)
缺點:占用的帶寬較高
備注:70年代CCITT公布的G.711 64kb/s脈沖編碼調制PCM。
?
4.2????? G.721
制定者:ITU-T
所需帶寬:32Kbps
音頻頻寬:3.4KHZ
特性:相對于PCMA和PCMU,其壓縮比較高,可以提供2:1的壓縮比。
優點:壓縮比大
缺點:聲音質量一般
備注:子帶ADPCM(SB-ADPCM)技術。G.721標準是一個代碼轉換系統。它使用ADPCM轉換技術,實現64 kb/s A律或μ律PCM速率和32 kb/s速率之間的相互轉換。
?
4.3????? G.722
制定者:ITU-T
所需帶寬:64Kbps
音頻寬度:7KHZ
特性:G722能提供高保真的語音質量
優點:音質好
缺點:帶寬要求高
備注:子帶ADPCM(SB-ADPCM)技術
?
4.4????? G.722.1
制定者:ITU-T
所需帶寬:32Kbps/24Kbps
音頻寬度:7KHZ
特性:可實現比G.722 編解碼器更低的比特率以及更大的壓縮。目標是以大約一半的比特率實現? G.722 大致相當的質量。
優點:音質好
缺點:帶寬要求高
備注:目前大多用于電視會議系統。
4.5????? G.722.1附錄C
制定者:ITU-T
所需帶寬:48Kbps/32Kbps/4Kbps
音頻寬度:14KHZ
特性:采用自Polycom 的Siren?14 專利算法,與早先的寬頻帶音頻技術相比具有突破性的優勢,提供了低時延的14 kHz 超寬頻帶音頻,而碼率不到MPEG4 AAC-LD 替代編解碼器的一半,同時要求的運算能力僅為十分之一到二十分之一,這樣就留出了更多的處理器周期來提高視頻質量或者運行因特網應用程序,并且移動設備上的電池續航時間也可延長。
優點:音質更為清晰,幾乎可與CD 音質媲美,在視頻會議等應用中可以降低聽者的疲勞程度。
缺點:是Polycom的專利技術。
備注:目前大多用于電視會議系統
4.6????? G.723(低碼率語音編碼算法)
制定者:ITU-T
所需帶寬:5.3Kbps/6.3Kbps
音頻寬度:3.4KHZ
特性:語音質量接近良,帶寬要求低,高效實現,便于多路擴展,可利用C5402片內16kRAM實現53coder。達到ITU-TG723要求的語音質量,性能穩定。可用于IP電話語音信源編碼或高效語音壓縮存儲。
優點:碼率低,帶寬要求較小。并達到ITU-TG723要求的語音質量,性能穩定。
缺點:聲音質量一般
備注:G.723語音編碼器是一種用于多媒體通信,編碼速率為5.3kbits/s和6.3kbit/s的雙碼率編碼方案。G.723標準是國際電信聯盟(ITU)制定的多媒體通信標準中的一個組成部分,可以應用于IP電話等系統中。其中,5.3kbits/s碼率編碼器采用多脈沖最大似然量化技術(MP-MLQ),6.3kbits/s碼率編碼器采用代數碼激勵線性預測技術。
4.7????? G.723.1(雙速率語音編碼算法)
制定者:ITU-T
所需帶寬:5.3Kbps(22.9)
音頻寬度:3.4KHZ
特性:能夠對音樂和其他音頻信號進行壓縮和解壓縮,但它對語音信號來說是最優的。G.723.1采用了執行不連續傳輸的靜音壓縮,這就意味著在靜音期間的比特流中加入了人為的噪聲。除了預留帶寬之外,這種技術使發信機的調制解調器保持連續工作,并且避免了載波信號的時通時斷。
優點:碼率低,帶寬要求較小。并達到ITU-TG723要求的語音質量,性能穩定,避免了載波信號的時通時斷。
缺點:語音質量一般
備注:G.723.1算法是ITU-T建議的應用于低速率多媒體服務中語音或其它音頻信號的壓縮算法,其目標應用系統包括H.323、H.324等多媒體通信系統 。目前該算法已成為IP電話系統中的必選算法之一。
4.8????? G.728
制定者:ITU-T
所需帶寬:16Kbps/8Kbps
音頻寬度:3.4KHZ
特性:用于IP電話、衛星通信、語音存儲等多個領域。G.728是一種低時延編碼器,但它比其它的編碼器都復雜,這是因為在編碼器中必須重復做50階LPC分析。G.728還采用了自適應后置濾波器來提高其性能。
優點:后向自適應,采用自適應后置濾波器來提高其性能
缺點:比其它的編碼器都復雜
備注:G.728 16kb/s短延時碼本激勵線性預測編碼(LD-CELP)。1996年ITU公布了G.728 8kb/s的CS-ACELP算法,可以用于IP電話、衛星通信、語音存儲等多個領域。16 kbps G.728低時延碼激勵線性預測。
? ?? ? G.728是低比特線性預測合成分析編碼器(G.729和G.723.1)和后向ADPCM編碼器的混合體。G.728是LD-CELP編碼器,它一次只處理5個樣點。對于低速率(56~128 kbps)的綜合業務數字網(ISDN)可視電話,G.728是一種建議采用的語音編碼器。由于其后向自適應特性,因此G.728是一種低時延編碼器,但它比其它的編碼器都復雜,這是因為在編碼器中必須重復做50階LPC分析。G.728還采用了自適應后置濾波器來提高其性能。
4.9????? G.729
制定者:ITU-T
所需帶寬:8Kbps
音頻寬度:3.4KHZ
特性:在良好的信道條件下要達到長話質量,在有隨機比特誤碼、發生幀丟失和多次轉接等情況下要有很好的穩健性等。這種語音壓縮算法可以應用在很廣泛的領域中,包括IP電話、無線通信、數字衛星系統和數字專用線路。
? ?? ? G.729算法采用“共軛結構代數碼本激勵線性預測編碼方案”(CS-ACELP)算法。這種算法綜合了波形編碼和參數編碼的優點,以自適應預測編碼技術為基礎,采用了矢量量化、合成分析和感覺加權等技術。
? ?? ? G.729編碼器是為低時延應用設計的,它的幀長只有10ms,處理時延也是10ms,再加上5ms的前視,這就使得G.729產生的點到點的時延為25ms,比特率為8 kbps。
優點:語音質量良,應用領域很廣泛,采用了矢量量化、合成分析和感覺加權,提供了對幀丟失和分組丟失的隱藏處理機制。
缺點:在處理隨機比特錯誤方面性能不好。
備注:國際電信聯盟(ITU-T)于1995年11月正式通過了G.729。ITU-T建議G.729也被稱作“共軛結構代數碼本激勵線性預測編碼方案”(CS-ACELP),它是當前較新的一種語音壓縮標準。G.729是由美國、法國、日本和加拿大的幾家著名國際電信實體聯合開發的。
?
4.10G.729A
制定者:ITU-T
所需帶寬:8Kbps(34.4)
音頻寬度:3.4KHZ
特性:復雜性較G.729低,性能較G.729差。
優點:語音質量良,降低了計算的復雜度以便于實時實現,提供了對幀丟失和分組丟失的隱藏處理機制
缺點:性能較G.729差
備注:96年ITU-T又制定了G.729的簡化方案G.729A,主要降低了計算的復雜度以便于實時實現,因此目前使用的都是G.729A。
?
4.11MPEG-1 audio layer 1
制定者:MPEG
所需帶寬:384kbps(壓縮4倍)
音頻寬度:
特性:編碼簡單,用于數字盒式錄音磁帶,2聲道,VCD中使用的音頻壓縮方案就是MPEG-1層Ⅰ。
優點:壓縮方式相對時域壓縮技術而言要復雜得多,同時編碼效率、聲音質量也大幅提高,編碼延時相應增加。可以達到“完全透明”的聲音質量(EBU音質標準)
缺點:頻寬要求較高
備注:MPEG-1聲音壓縮編碼是國際上第一個高保真聲音數據壓縮的國際標準,它分為三個層次:
--層1(Layer 1):編碼簡單,用于數字盒式錄音磁帶
--層2(Layer 2):算法復雜度中等,用于數字音頻廣播(DAB)和VCD等
--層3(Layer 3):編碼復雜,用于互聯網上的高質量聲音的傳輸,如MP3音樂壓縮10倍
?
4.12MPEG-1 audio layer 2,即MP2
制定者:MPEG
所需帶寬:256~192kbps(壓縮6~8倍)
音頻寬度:
特性:算法復雜度中等,用于數字音頻廣播(DAB)和VCD等,2聲道,而MUSICAM由于其適當的復雜程度和優秀的聲音質量,在數字演播室、DAB、DVB等數字節目的制作、交換、存儲、傳送中得到廣泛應用。
優點:壓縮方式相對時域壓縮技術而言要復雜得多,同時編碼效率、聲音質量也大幅提高,編碼延時相應增加。可以達到“完全透明”的聲音質量(EBU音質標準)
缺點:
備注:同MPEG-1 audio layer 1
?
4.13MPEG-1 audio layer 3(MP3)
制定者:MPEG
所需帶寬:128~112kbps(壓縮10~12倍)
音頻寬度:
特性:編碼復雜,用于互聯網上的高質量聲音的傳輸,如MP3音樂壓縮10倍,2聲道。MP3是在綜合MUSICAM和ASPEC的優點的基礎上提出的混合壓縮技術,在當時的技術條件下,MP3的復雜度顯得相對較高,編碼不利于實時,但由于MP3在低碼率條件下高水準的聲音質量,使得它成為軟解壓及網絡廣播的寵兒。
優點:壓縮比高,適合用于互聯網上的傳播
缺點:MP3在128KBitrate及以下時,會出現明顯的高頻丟失
備注:同MPEG-1 audio layer 1
4.14MPEG-2 audio layer
制定者:MPEG
所需帶寬:與MPEG-1層1,層2,層3相同
音頻寬度:
特性:MPEG-2的聲音壓縮編碼采用與MPEG-1聲音相同的編譯碼器,層1, 層2和層3的結構也相同,但它能支持5.1聲道和7.1聲道的環繞立體聲。
優點:支持5.1聲道和7.1聲道的環繞立體聲
缺點:
備注:MPEG-2的聲音壓縮編碼采用與MPEG-1聲音相同的編譯碼器,層1, 層2和層3的結構也相同,但它能支持5.1聲道和7.1聲道的環繞立體聲。
4.15AAC-LD (dvanced Audio Coding,先進音頻編碼)
制定者:MPEG
所需帶寬:48-64 kbps
音頻寬度:22KHZ
特性:提供高質量的低延時的音頻編碼標準,以其20ms的算法延時提供更高的比特率和各種聲音信號的高質量音頻。
缺點:?
備注:超寬帶編解碼器技術支持高達48KHz采樣率的語音傳輸,與傳統的窄帶與寬帶語音編解碼器相比大幅提高了音質。該技術可提供接近CD音質的音頻,數據速率高達48–64kbps,不僅提高了IP語音與視頻應用的清晰度,而且支持電話音樂傳輸功能。高清語音通道支持更高的采樣率,配合音頻編解碼器的高保真音效,顯著豐富并擴展了頻譜兩端的音質范圍,有效改善了語音回響性能,提高了清晰度。
評論
查看更多