MP3常用音頻格式詳細解說
MP3常用音頻格式詳細解說
一.技術原理
1.音頻格式
數字化音頻格式的出現,是為了滿足復制、存儲、傳輸的需求。簡單的說,早期的模擬音頻格式,存在著復制失真和因為介質磨損而失效的問題。從CD盤的存儲開始,數字格式音頻文件開始普及,但又產生了一個問題——存儲體積上的限制,同時CD盤仍然存在磨損的現象,如果保存到硬盤上(相對存儲時間更長),在當時存儲介質(主要是硬盤)仍然昂貴的情況下,也不是好的解決方法。而互聯網的出現,更產生了遠距離傳輸文件的要求,在帶寬的制約下,縮小文件體積的需求變得更加強烈,這些都從外部因素上導致了有損壓縮數字音頻格式產生!
而從內部因素來說,隨著電腦運算、編碼能力的提高、各種聲學心理模式的進步,促進了各種有損壓縮數字音頻格式的層出不窮。如果光從歷史及現在曾經涌現出的編碼格式來看,應該會列舉出很多,而在MP3機上使用的音頻格式,我們向大家介紹的主要有如下幾種——MP3(CBR、VBR、ABR)、WMA、ADPCM。
(1)MP3(CBR、VBR、ABR)
MP3應該算目前使用用戶最多的有損壓縮數字音頻格式了。它的全稱是MPEG(MPEG:Moving Picture Experts Group) Audio Layer-3,1993年由德國夫朗和費研究院和法國湯姆生公司合作發展成功。
剛出現時它的編碼技術并不完善,它更像一個編碼標準框架,留待人們去完善。早期的MP3編碼采用的的是固定編碼率的方式(CBR ),我們常看到的128KBPS,就是代表它是以128KBPS固定數據速率編碼——你可以提高這個編碼率,最高可以到320KBPS,音質會更好,自然,文件的體積會相應增大。
因為MP3的編碼方式是開放的,你可以在這個標準框架的基礎上自己選擇不同的聲學原理進行壓縮處理,所以,很快由Xing公司推出可變編碼率的壓縮方式(VBR)。它的原理就是利用將一首歌的復雜部分用高 bitrate 編碼,簡單部分用低 bitrate 編碼,通過這種方式,進一步取得質量和體積的統一。當然,早期的Xing 編碼器的 VBR 算法很差,音質與 CBR (固定碼率)相去甚遠。但是,這種算法指明了一種方向,其他開發者紛紛推出自己的VBR算法,使得效果一直在改進。目前公認比較好的首推 LAME,它完美地實現了 VBR 算法,而且它是是完全免費的軟件,并且由愛好者組成的開發團隊一直在不斷的發展完善。
而在VBR的基礎上,LAME更加發展出ABR算法。ABR(Average Bitrate)平均比特率,是VBR的一種插值參數。LAME針對CBR不佳的文件體積比和VBR生成文件大小不定的特點獨創了這種編碼模式。ABR在指定的文件大小內,以每50幀(30幀約1秒)為一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態表現時使用高流量,可以做為VBR和CBR的一種折衷選擇。
(2)WMA
WMA是Windows Media Audio的縮寫,是微軟力推的數字音樂格式。微軟官方宣布的資料中稱WMA格式的可保護性極強,甚至可以限定播放機器、播放時間及播放次數,具有相當的版權保護能力。
? 應該說,WMA的推出,就是針對MP3沒有版權限制的缺點而來——普通用戶可能很歡迎這種格式,但作為版權擁有者的唱片公司來說,它們更喜歡難以復制拷貝的音樂壓縮技術,而微軟的WMA則照顧到了這些唱片公司的需求,可以預見,唱片業可能將全力支持WMA標準。
除了版權保護外,WMA還在壓縮比上進行了深化,它的目標是在相同音質條件下文件體積可以變的更小(當然,只在MP3低于192KBPS碼率的情況下有效,實際上當采用LAME算法壓縮MP3格式時,高于192KBPS時普遍的反映是MP3的音質要好于WMA)。
不管怎么說,微軟想介入的領域,它總能憑著自己的強大實力和在軟件上的壟斷地位,獲得它想要的東西(盡管技術上它并不總是最出色)——這場戰爭應該是微軟在數碼音頻格式領域的另一個IE與Netscape的戰爭版本。
小結:因為本文的目的是針對MP3機上使用的數碼音頻格式而撰寫的,所以,在播放格式上我只介紹目前MP3上常用的兩種格式:MP3與WMA。如果從數碼音頻格式的角度來說,除了提到的這兩個格式外,還有很多其他的格式:RA、MIDI、VQF、ATRAC、ATRAC3、Vorbis、AIF/AIFF、MP3PRO、Ogg、Dolby?Pro Logic?、Dolby Digital 5.1、Qdesign QDX、ATRAC3、VoiceAge等等。
其實隨著電腦運算能力的增強、聲學原理認識的進步、壓縮技術的發展,還會涌現出更多的數字壓縮音頻格式——相比前面提到的MP3、WMA,它們或者從壓縮比上下工夫、或者從版權保護上下工夫(有正反的取舍,有的要,有的不要)、或者從音質上下工夫。
但是,請注意:格式的技術先進并不代表市場!
一種格式的流行,乃至成為一種使用數量上的標準,除了技術因素外,還取決于其他的因素。就我個人的看法,先入為主的影響是很大的,以MP3來說,正因為目前它在用戶規模上是最大的,所以盡管它的壓縮比、音質、版權保護方面都存在缺點,但是用戶很容易形成一種慣性——獲得MP3文件越容易,越多用戶加入這個行列;反過來促進越多文件采用這種格式存儲——這就形成了一個正向循環,加上因為更多的播放軟件支持MP3、更多的第三方開發更先進的編碼算法,這些都推動MP3在自身格式上的進步,又導致用戶使用上的更加普及(正如我上面提到的那么多種格式,讀者不說曾經使用過或了解,有些格式的名稱大家是否聽過都是疑問)。
所以,短期內我個人還是看好MP3格式的發展——除了上面提到的非技術因素外,隨著存儲介質容量和網絡帶寬的進一步增大,壓縮比或許正變得不那么重要了(我現在敢大膽的使用高于192KBPS碼率壓縮自己的CD,遇到經典的,我甚至直接使用320KBPS,原因無它,我的電腦硬盤是40G,而這個配置還在逐漸落伍);版權保護也是雙刃劍,對廠商而言是好事,對用戶則是排斥的心理。
因此,在本章節的最后,我并不做MP3、WMA格式與其他格式的對比,僅以這兩個目前在MP3機上使用最頻繁的格式來做一番對比。
從壓縮比角度來說,在低于192KBPS的條件下,WMA可以在同樣音質條件下獲得比MP3文件更小的體積——甚至一半。
所以如果你的MP3容量并不大,而且你并不追求音質的更完美(特別當你的用途是聽一些英語教材、相聲、評書類不要求音質、回放效果的時候),假如你的MP3機支持WMA格式的播放,那么恭喜你——你的MP3機容量可以變相的增大一倍。
反過來,如果你的MP3容量有夠大(目前的主流應該是往128M發展),而且又注重音質感受,那么強烈建議你使用LAME壓縮算法平均192KBPS以上碼率壓縮,你會發現,和你往常使用的128KBPS碼率文件相比,會獲得不同的感受(當然,還和MP3機的音質處理效果、耳機的選擇相關)。
這些是從我個人使用中獲得的感受,你可以參考。但是更重要的是自己去嘗試——因為MP3機正越來越往多檔次方向發展——高、中、低端的MP3日趨細分:質量、功能、價格上都如是,只有配合自己的具體機型,通過實踐,才能找到適合自己的格式及編碼率。
(3)ADPCM格式
這個格式常用在MP3機的錄音方面。我們常看到某款具有錄音功能的MP3機在參數介紹上會標注“支持MP3,WMA,ADPCM格式”。
它其實也是一種編碼格式,但針對的是文件體積的更小——自然音質上就沒有什么優秀可言了。比如作為采訪時的錄音,32M的閃存,用這種格式錄制,可以存儲大約2個小時的錄音。從音質和文件大小的統一性來說,應該是目前一個好的解決方案。
除了外錄(采訪、課堂錄音)外,還有的MP3機使用這種格式進行對CD、磁帶機的直接錄制。可想而知,這樣的源文件你還是以英語讀物、相聲類的為主,如果你想要錄制音樂類的,勸你還是放棄,這種格式錄制出來的效果用來聽音樂只能用慘不能睹來形容。
小結:錄音格式上,目前除了繼續采用ADPCM格式外,越來越多的MP3機開始支持直接用MP3、WMA編碼(特別在直接錄制上)。但是這里要提出的一點是,MP3機的DSP在運算能力上比起電腦的CPU配合專門的編碼軟件還是差距太大,所以目前的產品里,我個人是不推薦用這種機器來直接錄制音樂類文件,但相信隨著集成電路的不斷發展,這個功能會不斷進步,最終將出現滿足要求的直接錄制產品——正如電腦上的部件發展一樣,軟件和硬件的互相促進、互相融合,終將帶來合乎要求的產品。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
相關閱讀:
- [電子說] 使用MC34063設計的mp3播放器充電器 2023-10-06
- [電子說] 科普什么是語音芯片 2023-09-14
- [電子說] 安川運動控制器MP3300有哪些優勢 2023-09-14
- [電子說] KT142C-sop16語音芯片的4個IO口如何一對一觸發播放_配置文件詳細說明 2023-09-13
- [音視頻及家電] 音頻格式有哪些? 2023-09-13
- [電子說] KT142C-sop16語音芯片ic的功耗詳細說明_實測_以及功耗機制 2023-09-11
- [電子說] 基于CW32的MP3播放器設計 2023-09-06
- [電子說] 集成壓力傳感與和弦播放電子琴方案,多功能音樂MP3芯片N9300-S16 2023-08-22
( 發表人:admin )