由于在音響系統中的重要地位,愛好音響的朋友或發燒友,都會熱衷于選擇一款好的“解碼器”(DAC),而“解碼”技術,又總是大家津津樂道或爭論的話題。到底哪一種技術更好、更有優勢、更適合大家來使用呢?
本文簡單羅列和梳理音頻DAC的基礎技術、分析一些熱點,希望能給需要的朋友提供一點有用的信息或提示,或者,能解除一些疑惑。
“解碼器”不是解碼器
第一件事情,先統一一下名稱和術語。我們習慣上稱之為“解碼器”的DAC,英文的書寫是:Digital-To-Analog Converter,意思是:數碼-模擬轉換器,而真正解碼器的英文書寫是:Decoder。為了統一而不至于造成誤解,以下,DAC或保持其英文縮寫(DAC)或稱為數模轉換器(有的情況下簡稱為轉換器),俗稱“解碼”則稱為數模轉換。
1
最早的轉換器不是電的
有記錄的最早的數模轉換器,可能是18世紀土耳其奧托曼帝國水壩上使用的二進制權水量測量系統,竟然不是在電的領域!
18世紀二進制權水量系統
首次對聲音的數模轉換是在電話線上,采樣頻率4kHz
從1753年有電報,大概1825年開始大規模發展起,各種電子數模轉換技術開始在通訊系統大量使用。1853年美國發明家 M.B.Farmer 構思了時域分配的多路復用(TDM)的概念來分時使用電報線路。1875年Bell發明電話后,1903年,Willard.M.Miner 獲得了用機電旋轉多路開關按 4.32kHz 或 3.5kHz 的頻度對聲音采樣然后再還原的多路復用技術的美國專利,用于電話線路,算是第一次有人把數模轉換用到了聲音上了。
最早的PCM只有5個比特
數模轉換的算法,1921年美國西部電氣的Paul M.Rainey發明了利用光和光電管實現的PCM(脈沖密度調制)技術,只用了5個比特的數字信號。1937年法國國際電話和電報公司(ITT)的Alec Harley Reeves(再次)發明了使用電子管的PCM,實現了有記錄的第一個全電子數模轉換器。
數模轉換器的處理技術(實現方法)也是從最早機械的、到機電的、光電的、真空管的、逐步地發展到了使用薄膜電阻、晶體管、CMOS集成電路和現在的大規模CMOS集成電路(芯片)。大規模集成電路,給了數據處理很大的便利和空間。
美國ANALOG DEVICES公司的混合信號終端
數模轉換器有很多種結構
從數模轉換器的結構看,最簡單的是串式DAC(又叫Kelvin分壓器),就是加上電壓的一串電阻,通過數字控制的一組開關接通不同的抽頭(電阻),得到不同的輸出電壓。是Lord Kelvin在1800中葉提出,在1920年代才開始實施的,最先是用電阻和繼電器、之后用了電子管來實現的。此后是一串數模轉換器的進化的名單:
電流輸出的分壓式DAC、
二進制權電阻DAC、
R-2R梯形電阻網絡DAC、
分段式DAC、
過采樣插值DAC、
乘法DAC、
預判非線性DAC、
PWM(脈沖寬度調制)DAC、
環形串行DAC、
和SAR(逐步接近式)ADC(模擬數字轉換器)配合的DAC、
Sigma-Delta DAC、
等等。
技術的發展可謂名目繁多,以下討論重點:
2
R-2R梯形電阻網絡DAC
是一位叫B.D.Smith的人在1953年首先提出,來用于數模轉換的。技術的核心,是通過電阻分壓,來得到輸出信號的值,而電阻分壓的網絡,是由數字量來控制的,這樣實現從數字量到模擬量的轉換。
典型的R-2R梯形電阻網絡(8位)結構
這是一個巧妙的設計,每個電阻回路(梯級)的阻值都是上一級回路的一半,這樣正好實現了二進制加權的運算,與權電阻的數模轉換器需要用到大量阻值的電阻相比,R-2R數模轉換器僅需要兩種阻值的電阻就可以實現,既簡單又可靠。
現在的R-2R DAC有單一芯片的方案(如TI的PCM1704,經過激光精密矯正制造,動態范圍可以達到112dB),也有使用定制模塊的,或者直接在電路板(PCB)上實現,取決于不同的設計,各商家的成品DAC會有很大不同。用于音頻數模轉換,由于對轉換操作和電阻精度要求非常高,在設計方案和制作工藝上都有很高的要求。
TI公司的PCM1704(R-2R)DAC原理圖
R-2R DAC的好處
1)電阻是線性的
R-2R是古老和傳統PCM數模轉換的代表性技術。要在高性能的音頻數模轉換器上應用,想必是有一個理由的:通過電阻分壓進行轉換,理論上電阻是線性的,所以不會帶來失真和額外噪聲。這里, “電阻是線性的” 成為了核心概念。
2)避免過采樣和數字濾波
R-2R DAC可以僅通過對網絡中電阻的切換來進行數模轉換,不需要用到過采樣、插值、抽取等數字濾波的手段,避免使用數字濾波器。有人認為,數字濾波會帶來所謂的“數碼聲”(有待證實)。
這樣,大家可能會感覺這個技術很合理,但是,作為傳統的數模轉換技術,R-2R DAC是存在一些問題的:
R-2R DAC的問題
1)差分非線性誤差
R-2R數模轉換把模擬波形表示為一個幅度信號,半個量化梯度就是精度誤差,大信號時的影響不是主要的,在小信號時,影響會變大而不可忽略,不可避免地將產生差分非線性誤差,和信號有關聯,就成為了失真。因為非線性的程度是跟隨信號幅度變化而變化的,所以后期也比較難以處理。
2)過零失真
R-2R數模轉換還不可避免地會產生過零失真。每當最高為位電阻上的電壓發生變化時(從0到1,或相反),必然會引起輸出電壓極性的變化(從正到負,或相反),由于電阻誤差的存在,外加電阻網絡內部的電阻的同時切換,會在過零點引起差分非線性失真和短暫的電涌,產生過零失真。
R-2R DAC的過零失真
3)量化精度
數字音頻信號的深度,每增加1位,理論上會增加6dB的動態范圍,對于R-2R DAC來說,量化精度的高低將直接決定DAC可以達到的最大動態范圍。
通常CD是用16位的數字信號,有96dB的理論動態范圍,最低位的信號幅度是滿幅度值的1/65536,R-2R DAC處理這樣的信號,最高位的電阻誤差應該遠小于這個比值,最低位位上的信號才是有意義的。現在高精度電阻的誤差是 1/1000 ,相當于10位數字信號的最低位上的值(1/2^10=1/1024 ),也就是說,如果使用這樣的高精度電阻做R-2R DAC的最高位,10位以上深度的數字信號都是沒有意義的,因為那些位上的信號都被最高位電阻上的誤差所淹沒,DAC的動態范圍也不可能達到60dB。現在常常會播放32位的數字信號,最小位的信號幅度是1/2^32=1/4,294,967,296,那么,提出一個問題,電阻網絡怎樣能夠達到這樣的精度?
對于R-2R轉換,商家常常會嘗試一些方法,比如在制造上提高電阻的精度、對電阻網絡(特別是最高位、高位的電阻)進行矯正或補償、等等,盡可能地來提高精度以改善性能。實際上,要實現高性能的音頻數模轉換,R-2R DAC是需要克服許多難題的。
3
Delta調制技術標志一個新時代的開始
1950年,就像發明PCM一樣,也是法國的ITT公司的實驗室,提出了 Delta(增量)調制技術(由量化一個值改為量化一個值的增量),盡管,因為需要高頻的支持,在高速數字信號技術出現以前,各種限制阻止了這個技術(和后來的Sigma-Delta調制技術)在高質量音樂方面的應用,但還是標志了,數子音頻轉換技術的一個新的時代的開始,技術手段從量化信號的幅度轉變到量化信號的變化,關注點也從幅度轉向了時間。
Sigma-Delta DAC
同年美國Bell電話實驗室的C.C.Cutler也獲得了差分PCM調制技術的專利(Delta調制可以認為是差分PCM調制的一種簡單形式)。1952、1953年,荷蘭Phillips實驗室也發現了同樣的原理,并且提供了許多1位和多位的研究成果。1954年Cutler又獲得了非常有意義的過采樣和噪聲整形的專利,1962年,在Delta調制基礎上改進的Delta-Sigma(主要是增加了Sigma-積分)技術由Inose、Yasuda和Murakami正式提了出來,1970年代,AT&T的工程師改稱之為Sigma-Delta(可能更正確一些)。從此,數字音頻技術正式進入了Sigma-Delta時代。
Sigma-Delta是使用低位(1位或幾位)量化和高速采樣的技術,簡單描述,就是把被采樣的輸入信號與原先采樣的累計量化的信號差值進行比較(Delta),比較后得到的差值(確定是增加還是減少,如果是1位量化,則是1或0),再與上一次累計的量化差值相加(Sigma),再形成以PCM編碼的音頻信號的數字量,通過高的采樣頻率,來很好地跟蹤輸入信號的波形。
數模轉換,則是這個過程的逆向操作。
Sigma-Delta技術圖示
現代的數模轉換芯片,如有名的TI的PCM1794,Cirrus Logic的CS4398,AKM的AK4490等都使用了這個技術,各家公司可能僅僅會在這個技術的基礎上做一些改變來達到差異化的目的。
分段式DAC的一個應用
差異化的一個例子,TI公司在Sigma-Delta調制的基礎上再加入了分段調制的手段,把原來多位的數字信號,分解為高位和低位兩個部分(分段),因為它們分別的作用和效果有所不同,所以可以按不同目的來分別進行處理。PCM1794數模轉換芯片做了這樣的設計,用來實現出色的動態性能和改善對Jitter(抖動)的容忍度。
PCM1794數模轉換原理圖
Sigma-Delta是R-2R的一個替代方案
Sigma-Delta數模轉換技術是傳統PCM(按幅度量化)數模轉換的一個替代方案,與之前的R-2R技術相比,美國的Ken.C.Pohlmann在他的《數字音頻技術》(第6版)一書中有一段形象化的描述:
“傳統的梯形電阻網絡轉換器就像一行燈泡,每個燈泡都連接了一個開關。比如有16個燈泡,每個都有不同的亮度,可以通過點亮不同的組合來實現2^16或65536種不同的亮度級。不過,各個燈泡光強度上的差異會在輸出亮度級上引入誤差。任何特定的開關組合可能都不會精確產生所需的亮度。類似地,梯形電阻網絡轉換器在試圖重建音頻信號時也會引入誤差。
Sigma-Delta技術采用了完全不同的一種方式。它沒有使用多個燈泡和開關,而是僅使用了一個燈泡和一個開關,只是簡單地靠燈泡的亮和滅來改變亮度。例如,若讓燈泡在亮與滅之間不斷地切換,并且亮和滅的時間長度相等,則輸出就是一半的亮度。如果燈泡點亮的時間增長,則亮度也會增大。類似地,理想情況下Sigma-Delta轉換器可以用1個比特表示音頻幅度,只需要使用非常快速的切換和非常精確的定時即可。Sigma-Delta技術本身是一種表示音頻波形的精確方法。”
或者,更簡單地來描述兩者最根本的區別,R-2R數模轉換是以對幅度量化為基線進行轉換的,Sigma-Delta則是以保持幅度不變(1位調制)或基本不變(多位調制:一般為4~6位),而以時間為基線進行轉換的。
正因為如此,Sigma-Delta技術可以克服R-2R數模轉換技術的缺陷。主要的優勢在于:
1)提高量化的精度并在不同幅度上的精度保持一致,誤差與信號本身沒有關聯,就是噪聲,可以方便地在后期進行處理;
2)只在時間上對信號進行劃分,所以沒有過零誤差(失真);
3)通過過采樣(插值)、數字濾波(抽取)和噪聲整形,降低音頻范圍帶內的噪聲,動態范圍可較容易地達到120dB以上水準;
4)避免了使用磚墻式的模擬濾波器,以最小化相移和失真。
Sigma-Delta轉換技術要點
Sigma-Delta技術通過使用多倍于正常采樣頻率的高采樣頻率,把Nyquist頻率增加了多倍,采樣定理規定Nyquist頻率應不低于被采樣信號最高頻率的兩倍,對音頻即40kHz。比如CD采用的采樣頻率是44.1kHz,留出了一些余量。過采樣下,Nyquist頻率可以高達幾百kHz或更高,數字濾波會在Nyquist頻率與音頻頻帶之間清理出較大的空間,經過整形后的噪聲被最大化地整理到了Nyquist頻率以上的頻帶內,這樣就允許用簡單平緩的低階模擬濾波器,來輕松的濾除不需要的噪聲,同時最大化地保持信號的幅度和相位不受影響。
過采樣和數字濾波帶來的效果
克服不足的對策:
1)本底噪聲
Sigma-Delta技術中,1比特量化本身是線性的,但是本底噪聲將會比較高,如果使用多比特(比如4位),可以降低本底噪聲,但會帶來元件不一致(失配)導致的失真。一個解決方案是通過動態元件適配(DEM)技術,把不一致的元件進行隨機輪換,可以把失配誤差的平均值減小到接近于零,失配(失真)就轉變為帶內的噪聲,再通過整形,把噪聲轉移到帶外,動態范圍仍然可以保持在較高的水平。這一般是需要芯片制造商在后續作出安排的。
2)頻域非線性
可以理解為不同頻率下行為不一致的現象。美國的ESS公司提出,在頻域仿真中,Sigma-Delta調制器是非常非線性的系統,只能給出大概的性能表現。一個描述為 調制深度問題: 大多Sigma-Delta調制不能實現100%的調制深度(滿幅度只能到50%),而在調制深度加深時產生的直流分量將導致噪聲增加;另一個為 噪聲整形時的暫態非線性問題: 在信號快速變化時,噪聲整形的反饋電路會表現出暫態非線性的行為。
ESS公司也給出了解決方案,對Sigma-Delta調制器在細節上進行了不同的設計,級聯獨立穩定的低階調制器,仔細選擇集成器區的相對增益,使得削波的發生得到很好的控制。這樣,當調制深度接近100%時,各個低階的調制器都還是穩定的,ESS的HyperStream商標下的Sabre系列的DAC(如ES90xx、ES90xxPRO DAC芯片)的調制器可以達到90%的滿幅度值的調制深度,從而來應對上面的問題。
4
DSD原來是存檔的
還要說一下的是DSD。最開始時,DSD并不是作為可提供的格式來使用的。1988年,Sony公司收購CBS/Columbia唱片公司,獲得了大量優秀的磁帶錄音,Sony要把所有的磁帶檔案轉為數字格式的檔案,但是并不能確定未來何時會發布新的格式,也不能確定新格式的位數和頻率,為了保持靈活性,采用了新的1比特的格式,就是后來大家熟知的DSD,即Direct Stream Digital:直接流數字。
DSD和PCM****的關系
PCM是通用的音頻信號格式,大多用Sigma-Delta調制器,將音頻信號調制編碼成脈沖密度調制(PCM)的數字量(16、20、24或32位),按時間的次序進行排列。采樣頻率決定了數字量在時間上的排列密度,1981年推出的CD,音頻格式是16位的數字和44.1kHz的采樣頻率。
DSD是另一種音頻信號格式,利用很高的采用頻率,用Sigma-Delta調制器將音頻信號調制編碼成1比特的脈沖密度調制(PCM)的數字量。1999年,Phillips和Sony推出的SACD(超級音頻CD)使用的1比特的DSD編碼(雙聲道或多聲道),采樣頻率2.8224MHz。比較CD的16位數字和44.1kHz采樣頻率,SACD中的DSD信號的比特率是CD的4倍。
從上面可以看出,DSD和PCM事實上同屬于PCM,但目前習慣上的稱呼有著不同的含義。
隨著存儲媒體的多樣化,音頻格式也不再局限于CD或SACD的標準,可以有更多選擇,相應的DSD信號也可以被轉換成多種標準的PCM信號,下表為常用采樣頻率下可轉換的對應關系:
DSD的優點
1)DSD可以實現音頻頻帶內120dB動態范圍和100kHz的平坦頻率響應。
2)DSD使用高的采樣頻率,如SACD的2.8224MHz,Nyquist頻率也是很高的1.4112MHz,所以不需要在錄音過程中進行抽取數字濾波和PCM量化,也不需要在播放過程中使用過采樣(內插)的數字濾波器,甚至不需要通過數模轉換就可以直接進行播放;
3)使用較簡單的轉換器,可以降低播放設備的成本。
DSD的不足
1)噪聲
DSD信號含有內含有大量的高頻噪聲,是顯著的噪聲整形成分,分布在20kHz以上的頻帶內。如不加處理直接播放,理論上人的耳朵會過濾掉音頻頻帶以外的內容,不會影響到聽感,實際上用于播放的模擬放大器會因為這些信號而產生非線性的調制,產生音頻頻帶內的分量,影響到帶內的信號,或者這些大量的高頻分量會使放大器或揚聲器進入過載、飽和等不正常狀態;如在將DSD信號轉換為模擬信號后,嘗試濾除這些高頻分量來進行處理,那么在有限的頻帶空間中要濾除大量的這些高頻噪聲,需要用到較陡峭的高階的模擬濾波器,難以避免地會帶來頻帶內信號的嚴重相移。
DSD信號的噪聲頻譜
2)難以處理
DSD是1位的數字信號,理論上無法對其進行,比如,利用加入抖動(Dither)的處理方法來優化性能,如要使用其它替代方法,則會變得非常復雜(需要把1位信號轉變為如8位的DSD-wide或其它深度的信號再進行繁復的轉化處理)且要求處理器有更大的處理能力(DSD信號的密度更大需要更大的處理能力),有些處理可能是無法實現的。
3)轉換器的局限
DSD推出時,最好性能的轉換器是1位的Sigma-Delta轉換器,DSD理所當然地采用了1位的格式,之后的多位Sigma-Delta轉換器有更好的動態范圍性能,結果就是許多使用較早技術的DSD系統在性能上不如許多現代的PCM系統。
4)失真
信號內含失真是DSD最大的問題。DSD采用了1位的信號格式,噪聲整形在1位系統上很難真正有效,實際上整形后的噪聲是和信號相關的,就成為了信號中含有的固有失真。
5
FPGA是下一代的替代方案嗎?
FPGA近來成為了音頻處理的一個熱點。自美國的Xilinx公司在1985年推出全球第一款產品起,FPGA就是一項熱門的新技術,它的本質是邏輯電路,通過軟件可以改變邏輯電路的組合,因為信號是由硬件直接操作,所以速度就比通常的芯片(需要軟件計算的芯片,比如CPU)要快許多。
FPGA可以理解為一項處理技術,也即是實現某技術的手段,而非某技術本身。用于音頻數模轉換,音頻調制的算法需要FPGA通過編程來實現,包括一系列音頻處理上的問題,都是需要FPGA這個新的處理技術來作出回答的。
有的是另辟途徑,利用FPGA與R-2R梯形電阻網絡配合來實現更復雜或更高性能的R-2R數模轉換,有的是將FPGA用于數字信號的整形,來減小如Jitter(時基抖動)等的影響。
作為新的熱點,核心的問題就是:用FPGA芯片實現的數模轉換的性能,是否,會優于用專用數模轉換芯片實現的性能?這個處理技術(手段)能夠給音頻轉換技術帶來什么突破?或者解決什么問題?可以預見的是,FPGA有可能會在對信號的處理能力上帶來好處。目前看,這些都似乎還沒有一個統一的說法,在處理音頻調制、轉換一系列問題的解決方案上,應該也還沒有明確的模型。因此,效果尚難判斷,這里也很難再做進一步討論。
6
小結
R-2R轉換器要達到高質量的音頻轉換性能,需要解決許多難題;通用的FPGA芯片能否勝出專用轉換器芯片,還不得而知;Sigma-Delta,自被發明以來的70多年時間里,是最先進的音頻轉換技術,從1個比特到多比特的進步,更加地改進了轉換器的性能,如今在高質量音樂領域仍然有著主導的地位。隨著半導體(芯片)處理技術的進步,可用數字音頻信號的密度也在不斷提升,轉換器的性能或許不再是未來的問題,未來也許還有更多的可能,我們拭目以待。
-
解碼器
+關注
關注
9文章
1143瀏覽量
40717 -
繼電器
+關注
關注
132文章
5333瀏覽量
148810 -
數模轉換器
+關注
關注
14文章
1011瀏覽量
83166 -
CMOS集成電路
+關注
關注
4文章
41瀏覽量
14250 -
DAC芯片
+關注
關注
1文章
32瀏覽量
14613
發布評論請先 登錄
相關推薦
評論