一、前序
這里了解一下各個(gè)參數(shù)的含義以及一些基本概念。
聲音是連續(xù)模擬量,計(jì)算機(jī)將它離散化之后用數(shù)字表示,就有了以下幾個(gè)名詞術(shù)語(yǔ)。
樣本長(zhǎng)度(sample):樣本是記錄音頻數(shù)據(jù)最基本的單位,計(jì)算機(jī)對(duì)每個(gè)通道采樣量化時(shí)數(shù)字比特位數(shù),常見(jiàn)的有8位和16位。
通道數(shù)(channel):該參數(shù)為1表示單聲道,2則是立體聲。
幀(frame):幀記錄了一個(gè)聲音單元,其長(zhǎng)度為樣本長(zhǎng)度與通道數(shù)的乘積,一段音頻數(shù)據(jù)就是由苦干幀組成的。
采樣率(rate):每秒鐘采樣次數(shù),該次數(shù)是針對(duì)幀而言,常用的采樣率如8KHz的人聲, 44.1KHz的mp3音樂(lè), 96Khz的藍(lán)光音頻。
周期(period):音頻設(shè)備一次處理所需要的楨數(shù),對(duì)于音頻設(shè)備的數(shù)據(jù)訪問(wèn)以及音頻數(shù)據(jù)的存儲(chǔ),都是以此為單位。
交錯(cuò)模式(interleaved):是一種音頻數(shù)據(jù)的記錄方式
在交錯(cuò)模式下,數(shù)據(jù)以連續(xù)楨的形式存放,即首先記錄完楨1的左聲道樣本和右聲道樣本(假設(shè)為立體聲格式),再開(kāi)始楨2的記錄。
而在非交錯(cuò)模式下,首先記錄的是一個(gè)周期內(nèi)所有楨的左聲道樣本,再記錄右聲道樣本,數(shù)據(jù)是以連續(xù)通道的方式存儲(chǔ)。
不過(guò)多數(shù)情況下,我們只需要使用交錯(cuò)模式就可以了。
period(周期):?硬件中中斷間的間隔時(shí)間。它表示輸入延時(shí)。
比特率(Bits Per Second):比特率表示每秒的比特?cái)?shù),比特率=采樣率×通道數(shù)×樣本長(zhǎng)度
1、ALSA聲音編程介紹
ALSA表示高級(jí)Linux聲音體系結(jié)構(gòu)(Advanced Linux Sound Architecture)。
它由一系列內(nèi)核驅(qū)動(dòng),應(yīng)用程序編譯接口(API)以及支持Linux下聲音的實(shí)用程序組成。
這篇文章里,我將簡(jiǎn)單介紹 ALSA項(xiàng)目的基本框架以及它的軟件組成。主要集中介紹PCM接口編程,包括您可以自動(dòng)實(shí)踐的程序示例。
您使用ALSA的原因可能就是因?yàn)樗苄拢⒉皇俏ㄒ豢捎玫穆曇鬉PI。如果您想完成低級(jí)的聲音操作,以便能夠最大化地控制聲音并最大化地提高性能,或者如果您使用其它聲音API沒(méi)有的特性,那么ALSA是很好的選擇。如果您已經(jīng)寫(xiě)了一個(gè)音頻程序,你可能想要為ALSA聲卡驅(qū)動(dòng)添加本地支持。如果您對(duì)音頻不感興趣,只是想播放音頻文件,那么高級(jí)的API將是更好的選擇,比如SDL,OpenAL以及那些桌面環(huán)境提供的工具集。另外,您只能在有ALSA 支持的Linux環(huán)境中使用ALSA。
2、ALSA歷史
ALSA項(xiàng)目發(fā)起的起因是Linux下的聲卡驅(qū)動(dòng)(OSS/Free drivers)沒(méi)有得到積極的維護(hù)。并且落后于新的聲卡技術(shù)。Jaroslav Kysela早先寫(xiě)了一個(gè)聲卡驅(qū)動(dòng),并由此開(kāi)始了ALSA項(xiàng)目,隨便,更多的開(kāi)發(fā)者加入到開(kāi)發(fā)隊(duì)伍中,更多的聲卡得到支持,API的結(jié)構(gòu)也得到了重組。
Linux內(nèi)核2.5在開(kāi)發(fā)過(guò)程中,ALSA被合并到了官方的源碼樹(shù)中。在發(fā)布內(nèi)核2.6后,ALSA已經(jīng)內(nèi)建在穩(wěn)定的內(nèi)核版本中并將廣泛地使用。
3、數(shù)字音頻基礎(chǔ)
聲音由變化的氣壓組成。它被麥克風(fēng)這樣的轉(zhuǎn)換器轉(zhuǎn)換成電子形式。
模/數(shù)(ADC)轉(zhuǎn)換器將模擬電壓轉(zhuǎn)換成離散的樣本值。
聲音以固定的時(shí)間間隔被采樣,采樣的速率稱(chēng)為采樣率。把樣本輸出到數(shù)/模(DAC)轉(zhuǎn)換器,比如擴(kuò)音器,最后轉(zhuǎn)換成原來(lái)的模擬信號(hào)。
樣本大小以位來(lái)表示。樣本大小是影響聲音被轉(zhuǎn)換成數(shù)字信號(hào)的精確程度的因素之一。
另一個(gè)主要的因素是采樣率。奈奎斯特(Nyquist)理論中,只要離散系統(tǒng)的奈奎斯特頻率高于采樣信號(hào)的最高頻率或帶寬,就可以避免混疊現(xiàn)象。
4、ALSA基礎(chǔ)
ALSA由許多聲卡的聲卡驅(qū)動(dòng)程序組成,同時(shí)它也提供一個(gè)稱(chēng)為libasound的API庫(kù)。
應(yīng)用程序開(kāi)發(fā)者應(yīng)該使用libasound而不是內(nèi)核中的 ALSA接口。因?yàn)閘ibasound提供最高級(jí)并且編程方便的編程接口。并且提供一個(gè)設(shè)備邏輯命名功能,這樣開(kāi)發(fā)者甚至不需要知道類(lèi)似設(shè)備文件這樣的低層接口。
相反,OSS/Free驅(qū)動(dòng)是在內(nèi)核系統(tǒng)調(diào)用級(jí)上編程,它要求開(kāi)發(fā)者提供設(shè)備文件名并且利用ioctrl來(lái)實(shí)現(xiàn)相應(yīng)的功能。
為了向后兼容,ALSA提供內(nèi)核模塊來(lái)模擬OSS,這樣之前的許多在OSS基礎(chǔ)上開(kāi)發(fā)的應(yīng)用程序不需要任何改動(dòng)就可以在ALSA上運(yùn)行。另外,libaoss庫(kù)也可以模擬OSS,而它不需要內(nèi)核模塊。
ALSA包含插件功能,使用插件可以擴(kuò)展新的聲卡驅(qū)動(dòng),包括完全用軟件實(shí)現(xiàn)的虛擬聲卡。ALSA提供一系列基于命令行的工具集,比如混音器(mixer),音頻文件播放器(aplay),以及控制特定聲卡特定屬性的工具。
5、ALSA體系結(jié)構(gòu)
ALSA API可以分解成以下幾個(gè)主要的接口:
1 控制接口:提供管理聲卡注冊(cè)和請(qǐng)求可用設(shè)備的通用功能
2 PCM接口:管理數(shù)字音頻回放(playback)和錄音(capture)的接口。本文后續(xù)總結(jié)重點(diǎn)放在這個(gè)接口上,因?yàn)樗情_(kāi)發(fā)數(shù)字音頻程序最常用到的接口。
3 Raw MIDI接口:支持MIDI(Musical Instrument Digital Interface),標(biāo)準(zhǔn)的電子樂(lè)器。這些API提供對(duì)聲卡上MIDI總線的訪問(wèn)。這個(gè)原始接口基于MIDI事件工作,由程序員負(fù)責(zé)管理協(xié)議以及時(shí)間處理。
4 定時(shí)器(Timer)接口:為同步音頻事件提供對(duì)聲卡上時(shí)間處理硬件的訪問(wèn)。
5 時(shí)序器(Sequencer)接口
6 混音器(Mixer)接口
6、設(shè)備命名
API庫(kù)使用邏輯設(shè)備名而不是設(shè)備文件。設(shè)備名字可以是真實(shí)的硬件名字也可以是插件名字。硬件名字使用hw:i,j這樣的格式。其中i是卡號(hào),j是這塊聲卡上的設(shè)備號(hào)。
第一個(gè)聲音設(shè)備是hw:0,0.這個(gè)別名默認(rèn)引用第一塊聲音設(shè)備并且在本文示例中一真會(huì)被用到。
插件使用另外的唯一名字,比如 plughw:,表示一個(gè)插件,這個(gè)插件不提供對(duì)硬件設(shè)備的訪問(wèn),而是提供像采樣率轉(zhuǎn)換這樣的軟件特性,硬件本身并不支持這樣的特性。
7、聲音緩存和數(shù)據(jù)傳輸
每個(gè)聲卡都有一個(gè)硬件緩存區(qū)來(lái)保存記錄下來(lái)的樣本。
當(dāng)緩存區(qū)足夠滿時(shí),聲卡將產(chǎn)生一個(gè)中斷。
內(nèi)核聲卡驅(qū)動(dòng)然后使用直接內(nèi)存(DMA)訪問(wèn)通道將樣本傳送到內(nèi)存中的應(yīng)用程序緩存區(qū)。類(lèi)似地,對(duì)于回放,任何應(yīng)用程序使用DMA將自己的緩存區(qū)數(shù)據(jù)傳送到聲卡的硬件緩存區(qū)中。
這樣硬件緩存區(qū)是環(huán)緩存。也就是說(shuō)當(dāng)數(shù)據(jù)到達(dá)緩存區(qū)末尾時(shí)將重新回到緩存區(qū)的起始位置。
ALSA維護(hù)一個(gè)指針來(lái)指向硬件緩存以及應(yīng)用程序緩存區(qū)中數(shù)據(jù)操作的當(dāng)前位置。
從內(nèi)核外部看,我們只對(duì)應(yīng)用程序的緩存區(qū)感興趣,所以本文只討論應(yīng)用程序緩存區(qū)。
應(yīng)用程序緩存區(qū)的大小可以通過(guò)ALSA庫(kù)函數(shù)調(diào)用來(lái)控制。
緩存區(qū)可以很大,一次傳輸操作可能會(huì)導(dǎo)致不可接受的延遲,我們把它稱(chēng)為延時(shí)(latency)。
為了解決這個(gè)問(wèn)題,ALSA將緩存區(qū)拆分成一系列周期(period)(OSS/Free中叫片斷fragments).ALSA以period為單元來(lái)傳送數(shù)據(jù)。
一個(gè)周期(period)存儲(chǔ)一些幀(frames)。每一幀包含時(shí)間上一個(gè)點(diǎn)所抓取的樣本。對(duì)于立體聲設(shè)備,一個(gè)幀會(huì)包含兩個(gè)信道上的樣本。
分解過(guò)程:一個(gè)緩存區(qū)分解成周期,然后是幀,然后是樣本。
左右信道信息被交替地存儲(chǔ)在一個(gè)幀內(nèi)。這稱(chēng)為交錯(cuò) (interleaved)模式。
在非交錯(cuò)模式中,一個(gè)信道的所有樣本數(shù)據(jù)存儲(chǔ)在另外一個(gè)信道的數(shù)據(jù)之后。
8、Over and Under Run
當(dāng)一個(gè)聲卡活動(dòng)時(shí),數(shù)據(jù)總是連續(xù)地在硬件緩存區(qū)和應(yīng)用程序緩存區(qū)間傳輸。
但是也有例外。
在錄音例子中,如果應(yīng)用程序讀取數(shù)據(jù)不夠快,循環(huán)緩存區(qū)將會(huì)被新的數(shù)據(jù)覆蓋。這種數(shù)據(jù)的丟失被稱(chēng)為"over?? run".
在回放例子中,如果應(yīng)用程序?qū)懭霐?shù)據(jù)到緩存區(qū)中的速度不夠快,緩存區(qū)將會(huì)"餓死"。這樣的錯(cuò)誤被稱(chēng)為"under?? run"。
在ALSA文檔中,有時(shí)將這兩種情形統(tǒng)稱(chēng)為"XRUN"。適當(dāng)?shù)卦O(shè)計(jì)應(yīng)用程序可以最小化XRUN并且可以從中恢復(fù)過(guò)來(lái)。
XRUN狀態(tài)又分有兩種,在播放時(shí),用戶空間沒(méi)及時(shí)寫(xiě)數(shù)據(jù)導(dǎo)致緩沖區(qū)空了,硬件沒(méi)有 可用數(shù)據(jù)播放導(dǎo)致"under?? run"; 錄制時(shí),用戶空間沒(méi)有及時(shí)讀取數(shù)據(jù)導(dǎo)致緩沖區(qū)滿后溢出, 硬件錄制的數(shù)據(jù)沒(méi)有空閑緩沖可寫(xiě)導(dǎo)致"over?? run".?
當(dāng)用戶空間由于系統(tǒng)繁忙等原因,導(dǎo)致hw_ptr>appl_ptr時(shí),緩沖區(qū)已空,內(nèi)核這里有兩種方案:?
停止DMA傳輸,進(jìn)入XRUN狀態(tài)。這是內(nèi)核默認(rèn)的處理方法。?繼續(xù)播放緩沖區(qū)的重復(fù)的音頻數(shù)據(jù)或靜音數(shù)據(jù)。?
用戶空間配置stop_threshold可選擇方案1或方案2,配置silence_threshold選擇繼 續(xù)播放的原有的音頻數(shù)據(jù)還是靜意數(shù)據(jù)了。個(gè)人經(jīng)驗(yàn),偶爾的系統(tǒng)繁忙導(dǎo)致的這種狀態(tài), 重復(fù)播放原有的音頻數(shù)據(jù)會(huì)顯得更平滑,效果更好。?
9、音頻參數(shù)(ALSA 用戶空間之 TinyAlsa)
TinyAlsa是 Android 默認(rèn)的 alsalib, 封裝了內(nèi)核 ALSA 的接口,用于簡(jiǎn)化用戶空 間的 ALSA 編程。
合理的pcm_config可以做到更好的低時(shí)延和功耗,移動(dòng)設(shè)備的開(kāi)發(fā)優(yōu)為敏感。
struct pcm_config { unsigned int channels; unsigned int rate; unsigned int period_size; unsigned int period_count; enum pcm_format format; unsigned int start_threshold; unsigned int stop_threshold; unsigned int silence_threshold; int avail_min;};
解釋一下結(jié)構(gòu)中的各個(gè)參數(shù),每個(gè)參數(shù)的單位都是frame(1幀 = 通道*采樣位深):
period_size. 每次傳輸?shù)臄?shù)據(jù)長(zhǎng)度。值越小,時(shí)延越小,cpu占用就越高。
period_count. 緩之沖區(qū)period的個(gè)數(shù)。緩沖區(qū)越大,發(fā)生XRUN的機(jī)會(huì)就越少。
format. 定義數(shù)據(jù)格式,如采樣位深,大小端。
start_threshold. 緩沖區(qū)的數(shù)據(jù)超過(guò)該值時(shí),硬件開(kāi)始啟動(dòng)數(shù)據(jù)傳輸。如果太大, 從開(kāi)始播放到聲音出來(lái)時(shí)延太長(zhǎng),甚至可導(dǎo)致太短促的聲音根本播不出來(lái);如果太小, 又可能容易導(dǎo)致XRUN.
stop_threshold. 緩沖區(qū)空閑區(qū)大于該值時(shí),硬件停止傳輸。默認(rèn)情況下,這個(gè)數(shù) 為整個(gè)緩沖區(qū)的大小,即整個(gè)緩沖區(qū)空了,就停止傳輸。但偶爾的原因?qū)е戮彌_區(qū)空, 如CPU忙,增大該值,繼續(xù)播放緩沖區(qū)的歷史數(shù)據(jù),而不關(guān)閉再啟動(dòng)硬件傳輸(一般此 時(shí)有明顯的聲音卡頓),可以達(dá)到更好的體驗(yàn)。
silence_threshold. 這個(gè)值本來(lái)是配合stop_threshold使用,往緩沖區(qū)填充靜音 數(shù)據(jù),這樣就不會(huì)重播歷史數(shù)據(jù)了。但如果沒(méi)有設(shè)定silence_size,這個(gè)值會(huì)生效嗎? 求解??
avail_min. 緩沖區(qū)空閑區(qū)大于該值時(shí),pcm_mmap_write()才往緩沖寫(xiě)數(shù)據(jù)。這個(gè) 值越大,往緩沖區(qū)寫(xiě)入數(shù)據(jù)的次數(shù)就越少,面臨XRUN的機(jī)會(huì)就越大。Android samsung tuna 設(shè)備在screen_off時(shí)增大該值以減小功耗,在screen_on時(shí)減小該 值以減小XRUN的機(jī)會(huì)。
在不同的場(chǎng)景下,合理的參數(shù)就是在性能、時(shí)延、功耗等之間達(dá)到較好的平衡。
有朋友問(wèn)為什么在pcm_write()/pcm_mmap_write(),而不在pcm_open()調(diào)用pcm_start()? 這是因?yàn)橐纛l流與其它的數(shù)據(jù)不同,實(shí)時(shí)性要求很高。作為 TinyAlsa的實(shí)現(xiàn)者,不能假定在調(diào)用者open之后及時(shí)的write數(shù)據(jù),所以只能在有 數(shù)據(jù)寫(xiě)入的時(shí)候start設(shè)備了。
Mixer的實(shí)現(xiàn)很明了,通過(guò)ioctl()調(diào)用訪問(wèn)kcontrols.
10、一個(gè)典型的聲音程序
1 使用PCM的程序通常類(lèi)似下面的偽代碼:
2 打開(kāi)回放或錄音接口
3 設(shè)置硬件參數(shù)(訪問(wèn)模式,數(shù)據(jù)格式,信道數(shù),采樣率,等等)
4 while 有數(shù)據(jù)要被處理:
5 讀PCM數(shù)據(jù)(錄音)?或 寫(xiě)PCM數(shù)據(jù)(回放)
6 關(guān)閉接口
------------------------------------------------------------------------------------------------------------------------------------------------------------------
三、實(shí)例
1、顯示了一些ALSA使用的PCM數(shù)據(jù)類(lèi)型和參數(shù)。
#include int main() { int val; printf("ALSA library version: %s\n", SND_LIB_VERSION_STR); printf("\nPCM stream types:\n"); for (val = 0; val <= SND_PCM_STREAM_LAST; val++) printf(" %s\n", snd_pcm_stream_name((snd_pcm_stream_t)val)); printf("\nPCM access types:\n"); for (val = 0; val <= SND_PCM_ACCESS_LAST; val++) { printf(" %s\n", snd_pcm_access_name((snd_pcm_access_t)val)); } printf("\nPCM formats:\n"); for (val = 0; val <= SND_PCM_FORMAT_LAST; val++) { if (snd_pcm_format_name((snd_pcm_format_t)val)!= NULL) { printf(" %s (%s)\n", snd_pcm_format_name((snd_pcm_format_t)val), snd_pcm_format_description( (snd_pcm_format_t)val)); } } printf("\nPCM subformats:\n"); for (val = 0; val <= SND_PCM_SUBFORMAT_LAST;val++) { printf(" %s (%s)\n", snd_pcm_subformat_name(( snd_pcm_subformat_t)val), snd_pcm_subformat_description(( snd_pcm_subformat_t)val)); } printf("\nPCM states:\n"); for (val = 0; val <= SND_PCM_STATE_LAST; val++) printf(" %s\n", snd_pcm_state_name((snd_pcm_state_t)val)); return 0;}
首先需要做的是包括頭文件。這些頭文件包含了所有庫(kù)函數(shù)的聲明。其中之一就是顯示ALSA庫(kù)的版本。
這個(gè)程序剩下的部分的迭代一些PCM數(shù)據(jù)類(lèi)型,以流類(lèi)型開(kāi)始。ALSA為每次迭代的最后值提供符號(hào)常量名,并且提供功能函數(shù)以顯示某個(gè)特定值的描述字符串。你將會(huì)看到,ALSA支持許多格式,在我的1.0.15版本里,支持多達(dá)36種格式。
這個(gè)程序必須鏈接到alsalib庫(kù),通過(guò)在編譯時(shí)需要加上-lasound選項(xiàng)。有些alsa庫(kù)函數(shù)使用dlopen函數(shù)以及浮點(diǎn)操作,所以您可能還需要加上-ldl,-lm選項(xiàng)。
編譯:gcc -o main test.c -lasound
2、打開(kāi)默認(rèn)的PCM設(shè)備,設(shè)置一些硬件參數(shù)并且打印出最常用的硬件參數(shù)值
Int32 Audio_alsaSetparams(Alsa_Env *pEnv, int verbose){ Int32 err = 0; Uint32 rate, n; snd_pcm_t *handle; snd_output_t *log; snd_pcm_hw_params_t *params; snd_pcm_sw_params_t *swparams; snd_pcm_uframes_t buffer_size; snd_pcm_uframes_t start_threshold, stop_threshold; unsigned int buffer_time, period_time; handle = pEnv->handle; err = snd_output_stdio_attach(&log, stderr, 0); OSA_assert(err >= 0); snd_pcm_hw_params_alloca(¶ms); snd_pcm_sw_params_alloca(&swparams); err = snd_pcm_hw_params_any(handle, params); if (err < 0) { AUD_DEVICE_PRINT_ERROR_AND_RETURN("Broken configuration for this PCM:" "no configurations available(%s)\n", err, handle); } err = snd_pcm_hw_params_set_access(handle, params, SND_PCM_ACCESS_RW_INTERLEAVED); if (err < 0) { AUD_DEVICE_PRINT_ERROR_AND_RETURN("cannot set access type (%s)\n", err, handle); } err = snd_pcm_hw_params_set_format(handle, params, pEnv->format); if (err < 0) { AUD_DEVICE_PRINT_ERROR_AND_RETURN("cannot set sample format (%s)\n", err, handle); } err = snd_pcm_hw_params_set_channels(handle, params, pEnv->channels); if (err < 0) { AUD_DEVICE_PRINT_ERROR_AND_RETURN("cannot set channel count (%s)\n", err, handle); } rate = pEnv->rate; err = snd_pcm_hw_params_set_rate_near(handle, params, &pEnv->rate, 0); OSA_assert(err >= 0); if ((float)rate * 1.05 < pEnv->rate || (float)rate * 0.95 > pEnv->rate) { fprintf(stderr, "Warning: rate is not accurate" "(requested = %iHz, got = %iHz)\n", rate, pEnv->rate); } rate = pEnv->rate; /* following setting of period size is done only for AIC3X. Leaving default for HDMI */ if (pEnv->resample) { /* Restrict a configuration space to contain only real hardware rates. */ snd_pcm_hw_params_set_rate_resample(handle, params, 1); } buffer_time = 0; period_time = 0; if (pEnv->periods == 0) { err = snd_pcm_hw_params_get_buffer_time_max(params, &buffer_time, 0); OSA_assert(err >= 0); /* in microsecond */ if (buffer_time > 500000) buffer_time = 500000; /* 500ms */ } if (buffer_time > 0) period_time = buffer_time / 4; if (period_time > 0) err = snd_pcm_hw_params_set_period_time_near(handle, params, &period_time, 0); else err = snd_pcm_hw_params_set_period_size_near(handle, params, &pEnv->periods, 0); OSA_assert(err >= 0); if (period_time > 0) { err = snd_pcm_hw_params_set_buffer_time_near(handle, params, &buffer_time, 0); } else { buffer_size = pEnv->periods * 4; err = snd_pcm_hw_params_set_buffer_size_near(handle, params, &buffer_size); } OSA_assert(err >= 0); err = snd_pcm_hw_params(handle, params); if (err < 0) { fprintf(stderr, "cannot set alsa hw parameters %d\n", err); return err; } /* Get alsa interrupt duration */ snd_pcm_hw_params_get_period_size(params, &pEnv->periods, 0); snd_pcm_hw_params_get_buffer_size(params, &buffer_size); if (pEnv->periods == buffer_size) { fprintf(stderr, "Can't use period equal to buffer size (%lu == %lu)\n", pEnv->periods, buffer_size); return -1; } /* set software params */ snd_pcm_sw_params_current(handle, swparams); n = pEnv->periods; /* set minimum avil size -> 1 period size */ err = snd_pcm_sw_params_set_avail_min(handle, swparams, n); OSA_assert(err >= 0); n = buffer_size; /* in microsecond -> divide 1000000 */ if (pEnv->start_delay <= 0) start_threshold = n + (double)rate * pEnv->start_delay / 1000000; else start_threshold = (double)rate * pEnv->start_delay / 1000000; if (start_threshold < 1) start_threshold = 1; if (start_threshold > n) start_threshold = n; /* set pcm auto start condition */ err = snd_pcm_sw_params_set_start_threshold(handle, swparams, start_threshold); OSA_assert(err >= 0); /* in microsecond -> divide 1000000 */ if (pEnv->stop_delay <= 0) stop_threshold = buffer_size + (double)rate * pEnv->stop_delay / 1000000; else stop_threshold = (double)rate * pEnv->stop_delay / 1000000; err = snd_pcm_sw_params_set_stop_threshold(handle, swparams, stop_threshold); OSA_assert(err >= 0); err = snd_pcm_sw_params(handle, swparams); if (err < 0) { fprintf(stderr, "unable to install sw params\n"); return err; } if (verbose) snd_pcm_dump(handle, log); snd_output_close(log); return err;}
1)snd_pcm_open打開(kāi)默認(rèn)的PCM 設(shè)備并設(shè)置訪問(wèn)模式為PLAYBACK。這個(gè)函數(shù)返回一個(gè)句柄,這個(gè)句柄保存在第一個(gè)函數(shù)參數(shù)中。該句柄會(huì)在隨后的函數(shù)中用到。像其它函數(shù)一樣,這個(gè)函數(shù)返回一個(gè)整數(shù)。
2)如果返回值小于0,則代碼函數(shù)調(diào)用出錯(cuò)。如果出錯(cuò),我們用snd_errstr打開(kāi)錯(cuò)誤信息并退出。
3)為了設(shè)置音頻流的硬件參數(shù),我們需要分配一個(gè)類(lèi)型為snd_pcm_hw_param的變量。分配用到函數(shù)宏 snd_pcm_hw_params_alloca。
4)下一步,我們使用函數(shù)snd_pcm_hw_params_any來(lái)初始化這個(gè)變量,傳遞先前打開(kāi)的 PCM流句柄。
5)接下來(lái),我們調(diào)用API來(lái)設(shè)置我們所需的硬件參數(shù)。
這些函數(shù)需要三個(gè)參數(shù):PCM流句柄,參數(shù)類(lèi)型,參數(shù)值。
我們?cè)O(shè)置流為交錯(cuò)模式,16位的樣本大小,2 個(gè)信道,44100bps的采樣率。
對(duì)于采樣率而言,聲音硬件并不一定就精確地支持我們所定的采樣率,但是我們可以使用函數(shù) snd_pcm_hw_params_set_rate_near來(lái)設(shè)置最接近我們指定的采樣率的采樣率。
其實(shí)只有當(dāng)我們調(diào)用函數(shù) snd_pcm_hw_params后,硬件參數(shù)才會(huì)起作用。
6)程序的剩余部分獲得并打印一些PCM流參數(shù),包括周期和緩沖區(qū)大小。結(jié)果可能會(huì)因?yàn)槁曇粲布牟煌煌?/p>
運(yùn)行該程序后,做實(shí)驗(yàn),改動(dòng)一些代碼。把設(shè)備名字改成hw:0,0,然后看結(jié)果是否會(huì)有變化。設(shè)置不同的硬件參數(shù)然后觀察結(jié)果的變化。
3、添加聲音回放
/*This example reads standard from input and writesto the default PCM device for 5 seconds of data.*//* Use the newer ALSA API */#define ALSA_PCM_NEW_HW_PARAMS_API#include int main() { long loops; int rc; int size; snd_pcm_t *handle; snd_pcm_hw_params_t *params; unsigned int val; int dir; snd_pcm_uframes_t frames; char *buffer; /* Open PCM device for playback. */ rc = snd_pcm_open(&handle, "default", SND_PCM_STREAM_PLAYBACK, 0); if (rc < 0) { fprintf(stderr,"unable to open pcm device: %s\n",snd_strerror(rc)); exit(1); } /* Allocate a hardware parameters object. */ snd_pcm_hw_params_alloca(?ms); /* Fill it in with default values. */ snd_pcm_hw_params_any(handle, params); /* Set the desired hardware parameters. */ /* Interleaved mode */ snd_pcm_hw_params_set_access(handle, params, SND_PCM_ACCESS_RW_INTERLEAVED); /* Signed 16-bit little-endian format */ snd_pcm_hw_params_set_format(handle, params, SND_PCM_FORMAT_S16_LE); /* Two channels (stereo) */ snd_pcm_hw_params_set_channels(handle, params, 2); /* 44100 bits/second sampling rate (CD quality) */ val = 44100; snd_pcm_hw_params_set_rate_near(handle, params, &val, &dir); /* Set period size to 32 frames. */ frames = 32; snd_pcm_hw_params_set_period_size_near(handle, params, &frames, &dir); /* Write the parameters to the driver */ rc = snd_pcm_hw_params(handle, params); if (rc < 0) { fprintf(stderr, "unable to set hw parameters: %s\n", snd_strerror(rc)); exit(1); } /* Use a buffer large enough to hold one period */ snd_pcm_hw_params_get_period_size(params, &frames, &dir); size = frames * 4; /* 2 bytes/sample, 2 channels */ buffer = (char *) malloc(size); /* We want to loop for 5 seconds */ snd_pcm_hw_params_get_period_time(params,&val, &dir); /* 5 seconds in microseconds divided by * period time */ loops = 5000000 / val; while (loops > 0) //循環(huán)錄音 5 s { loops--; rc = read(0, buffer, size); if (rc == 0) //沒(méi)有讀取到數(shù)據(jù) { fprintf(stderr, "end of file on input\n"); break; } else if (rc != size)//實(shí)際讀取 的數(shù)據(jù) 小于 要讀取的數(shù)據(jù) { fprintf(stderr,"short read: read %d bytes\n", rc); } rc = snd_pcm_writei(handle, buffer, frames);//寫(xiě)入聲卡 (放音) if (rc == -EPIPE) { /* EPIPE means underrun */ fprintf(stderr, "underrun occurred\n"); snd_pcm_prepare(handle); } else if (rc < 0) { fprintf(stderr,"error from writei: %s\n",snd_strerror(rc)); } else if (rc != (int)frames) { fprintf(stderr,"short write, write %d frames\n", rc); } } snd_pcm_drain(handle); snd_pcm_close(handle); free(buffer); return 0;}
在這個(gè)例子中,我們從標(biāo)準(zhǔn)輸入中讀取數(shù)據(jù),每個(gè)周期讀取足夠多的數(shù)據(jù),然后將它們寫(xiě)入到聲卡中,直到5秒鐘的數(shù)據(jù)全部傳輸完畢。
這個(gè)程序的開(kāi)始處和之前的版本一樣---打開(kāi)PCM設(shè)備、設(shè)置硬件參數(shù)。我們使用由ALSA自己選擇的周期大小,申請(qǐng)?jiān)摯笮〉木彌_區(qū)來(lái)存儲(chǔ)樣本。然后我們找出周期時(shí)間,這樣我們就能計(jì)算出本程序?yàn)榱四軌虿シ?秒鐘,需要多少個(gè)周期。
在處理數(shù)據(jù)的循環(huán)中,我們從標(biāo)準(zhǔn)輸入中讀入數(shù)據(jù),并往緩沖區(qū)中填充一個(gè)周期的樣本。然后檢查并處理錯(cuò)誤,這些錯(cuò)誤可能是由到達(dá)文件結(jié)尾,或讀取的數(shù)據(jù)長(zhǎng)度與我期望的數(shù)據(jù)長(zhǎng)度不一致導(dǎo)致的。
我們調(diào)用snd_pcm_writei來(lái)發(fā)送數(shù)據(jù)。它操作起來(lái)很像內(nèi)核的寫(xiě)系統(tǒng)調(diào)用,只是這里的大小參數(shù)是以幀來(lái)計(jì)算的。我們檢查其返回代碼值。返回值為EPIPE表明發(fā)生了underrun,使得PCM音頻流進(jìn)入到XRUN狀態(tài)并停止處理數(shù)據(jù)。從該狀態(tài)中恢復(fù)過(guò)來(lái)的標(biāo)準(zhǔn)方法是調(diào)用snd_pcm_prepare()函數(shù),把PCM流置于PREPARED狀態(tài),這樣下次我們向該P(yáng)CM流中數(shù)據(jù)時(shí),它就能重新開(kāi)始處理數(shù)據(jù)。如果我們得到的錯(cuò)誤碼不是EPIPE,我們把錯(cuò)誤碼打印出來(lái),然后繼續(xù)。最后,如果寫(xiě)入的幀數(shù)不是我們期望的,則打印出錯(cuò)誤消息。 ? ? ?
這個(gè)程序一直循環(huán),直到5秒鐘的幀全部傳輸完,或者輸入流讀到文件結(jié)尾。然后我們調(diào)用snd_pcm_drain把所有掛起沒(méi)有傳輸完的聲音樣本傳輸完全,最后關(guān)閉該音頻流,釋放之前動(dòng)態(tài)分配的緩沖區(qū),退出。 ? ? ? ?
我們可以看到這個(gè)程序沒(méi)有什么用,除非標(biāo)準(zhǔn)輸入被重定向到了其它其它的文件。
嘗試用設(shè)備/dev/urandom來(lái)運(yùn)行這個(gè)程序,該設(shè)備產(chǎn)生隨機(jī)數(shù)據(jù):
./example3 ? ?
隨機(jī)數(shù)據(jù)會(huì)產(chǎn)生5秒鐘的白色噪聲。 ? ? ? ?
然后,嘗試把標(biāo)準(zhǔn)輸入重定向到設(shè)備/dev/null和/dev/zero上,并比較結(jié)果。改變一些參數(shù),例如采樣率和數(shù)據(jù)格式,然后查看結(jié)果的變化。
4、添加錄音
/*This example reads from the default PCM deviceand writes to standard output for 5 seconds of data.*//* Use the newer ALSA API */#define ALSA_PCM_NEW_HW_PARAMS_API#include int main() {long loops;int rc;int size;snd_pcm_t *handle;snd_pcm_hw_params_t *params;unsigned int val;int dir;snd_pcm_uframes_t frames;char *buffer;/* Open PCM device for recording (capture). */rc = snd_pcm_open(&handle, "default", SND_PCM_STREAM_CAPTURE, 0);if (rc < 0) { fprintf(stderr, "unable to open pcm device: %s\n", snd_strerror(rc)); exit(1);}/* Allocate a hardware parameters object. */snd_pcm_hw_params_alloca(?ms);/* Fill it in with default values. */snd_pcm_hw_params_any(handle, params);/* Set the desired hardware parameters. *//* Interleaved mode */snd_pcm_hw_params_set_access(handle, params, SND_PCM_ACCESS_RW_INTERLEAVED);/* Signed 16-bit little-endian format */snd_pcm_hw_params_set_format(handle, params, SND_PCM_FORMAT_S16_LE);/* Two channels (stereo) */snd_pcm_hw_params_set_channels(handle, params, 2);/* 44100 bits/second sampling rate (CD quality) */val = 44100;snd_pcm_hw_params_set_rate_near(handle, params, &val, &dir);/* Set period size to 32 frames. */frames = 32;snd_pcm_hw_params_set_period_size_near(handle, params, &frames, &dir);/* Write the parameters to the driver */rc = snd_pcm_hw_params(handle, params);if (rc < 0) { fprintf(stderr, "unable to set hw parameters: %s\n", snd_strerror(rc)); exit(1);}/* Use a buffer large enough to hold one period */snd_pcm_hw_params_get_period_size(params, &frames, &dir);size = frames * 4; /* 2 bytes/sample, 2 channels */buffer = (char *) malloc(size);/* We want to loop for 5 seconds */snd_pcm_hw_params_get_period_time(params, &val, &dir);loops = 5000000 / val;while (loops > 0) { loops--; rc = snd_pcm_readi(handle, buffer, frames); if (rc == -EPIPE) { /* EPIPE means overrun */ fprintf(stderr, "overrun occurred\n"); snd_pcm_prepare(handle); } else if (rc < 0) { fprintf(stderr, "error from read: %s\n", snd_strerror(rc)); } else if (rc != (int)frames) { fprintf(stderr, "short read, read %d frames\n", rc); } rc = write(1, buffer, size); if (rc != size) fprintf(stderr, "short write: wrote %d bytes\n", rc);}snd_pcm_drain(handle);snd_pcm_close(handle);free(buffer);return 0;}
當(dāng)打開(kāi)PCM設(shè)備時(shí)我們指定打開(kāi)模式為SND_PCM_STREAM_CPATURE。在主循環(huán)中,我們調(diào)用snd_pcm_readi()從聲卡中讀取數(shù)據(jù),并把它們寫(xiě)入到標(biāo)準(zhǔn)輸出。同樣地,我們檢查是否有overrun,如果存在,用與前例中相同的方式處理。
運(yùn)行清單4的程序?qū)浿茖⒔?秒鐘的聲音數(shù)據(jù),并把它們發(fā)送到標(biāo)準(zhǔn)輸出。你也可以重定向到某個(gè)文件。如果你有一個(gè)麥克風(fēng)連接到你的聲卡,可以使用某個(gè)混音程序(mixer)設(shè)置錄音源和級(jí)別。同樣地,你也可以運(yùn)行一個(gè)CD播放器程序并把錄音源設(shè)成CD。
運(yùn)行程序4并把輸出定向到某個(gè)文件,然后運(yùn)行程序 3播放該文件里的聲音數(shù)據(jù):
./listing4 ? > sound.raw
./listing3 ? < sound.raw
如果你的聲卡支持全雙工,你可以通過(guò)管道把兩個(gè)程序連接起來(lái),這樣就可以從聲卡中聽(tīng)到錄制的聲音:
./listing4 | ./listing3
同樣地,您可以做實(shí)驗(yàn),看看采樣率和樣本格式的變化會(huì)產(chǎn)生什么影響。
------------------------------------------------------------------------------------------------------------------------------------------------------------------
四、高級(jí)特性
在前面的例子中,PCM流是以阻塞模式操作的,也就是說(shuō),直到數(shù)據(jù)已經(jīng)傳送完,PCM接口調(diào)用才會(huì)返回。在事件驅(qū)動(dòng)的交互式程序中,這樣會(huì)長(zhǎng)時(shí)間阻塞應(yīng)用程序,通常是不能接受的。
ALSA支持以非阻塞模式打開(kāi)音頻流,這樣讀寫(xiě)函數(shù)調(diào)用后立即返回。如果數(shù)據(jù)傳輸被掛起,調(diào)用不能被處理,ALSA就是返回一個(gè) EBUSY的錯(cuò)誤碼。
許多圖形應(yīng)用程序使用回調(diào)來(lái)處理事件。ALSA支持以異步的方式打開(kāi)一個(gè)PCM音頻流。這使得當(dāng)某個(gè)周期的樣本數(shù)據(jù)被傳輸完后,某個(gè)已注冊(cè)的回調(diào)函數(shù)將會(huì)調(diào)用。
這里用到的snd_pcm_readi()和snd_pcm_writei()調(diào)用和Linux下的讀寫(xiě)系統(tǒng)調(diào)用類(lèi)似。
字母i表示處理的幀是交錯(cuò)式 (interleaved)的。ALSA中存在非交互模式的對(duì)應(yīng)的函數(shù)。
Linux下的許多設(shè)備也支持mmap系統(tǒng)調(diào)用,這個(gè)調(diào)用將設(shè)備內(nèi)存映射到主內(nèi)存,這樣數(shù)據(jù)就可以用指針來(lái)維護(hù)。
ALSA也運(yùn)行以mmap模式打開(kāi)一個(gè)PCM信道,這允許有效的零拷貝(zero copy)方式訪問(wèn)聲音數(shù)據(jù)。
最后,我希望這篇文章能夠激勵(lì)你嘗試編寫(xiě)某些ALSA程序。伴隨著2.6內(nèi)核在Linux發(fā)布版本(distributions)中被廣泛地使用,ALSA也將被廣泛地采用。它的高級(jí)特征將幫助Linux音頻程序更好地向前發(fā)展。
?
評(píng)論
查看更多