音頻編碼原理
語音編碼致力于:降低傳輸所需要的信道帶寬,同時保持輸入語音的高質量。
語音編碼的目標在于:設計低復雜度的編碼器以盡可能低的比特率實現高品質數據傳輸。
1、靜音閾值曲線:只在安靜環境下,人耳在各個頻率能聽到聲音的閾值。
2、臨界頻帶
由于人耳對不同頻率的解析度不同,MPEG1/Audio將22khz內可感知的頻率范圍,依不同編碼層,不同取樣頻率,劃分成23~26個臨界頻帶。下圖列出理想臨界頻帶的中心頻率與頻寬。圖中可看到,人耳對低頻的解析度較好。
3、頻域上的掩蔽效應:幅值較大的信號會掩蔽頻率相近的幅值較小的信號,如下圖:
4、時域上的遮蔽效應:在一個很短的時間內,若出現了2個聲音,SPL(sound pressure level)較大的聲音會掩蔽SPL較小的聲音。時域掩蔽效應分前向掩蔽(pre-masking)和后向掩蔽(post-masking),其中post-masking的時間會比較長,約是pre-masking的10倍。
時域遮蔽效應有助于消除前回音。
-
音頻編碼
+關注
關注
0文章
35瀏覽量
12872
發布評論請先 登錄
相關推薦
評論