WT2605-24SS音頻解碼芯片,實(shí)現(xiàn)寵物(玩具)喂食器遠(yuǎn)程更新語(yǔ)音技術(shù)方案解析
概述:本文主要介紹一種遠(yuǎn)程更新語(yǔ)音技術(shù)的實(shí)現(xiàn)方式,在一些產(chǎn)品應(yīng)用上,常常會(huì)遇到一些需要不停更換語(yǔ)音的場(chǎng)景(如寵物喂食器、寵物玩具需要經(jīng)常更換聲音,充電樁設(shè)備需要更換提示語(yǔ)等等),市面上常用的一些語(yǔ)音芯片大多都無法直接更換語(yǔ)音內(nèi)容,因此會(huì)存在一些無法避免的痛點(diǎn),有些產(chǎn)品會(huì)使用流媒體功能的芯片去播放,但是往往也伴隨著巨大的流量消耗以及網(wǎng)絡(luò)傳輸延遲,播放卡頓等現(xiàn)象,本文介紹的這一技術(shù)可降低對(duì)流量的消耗,下面著重介紹如何實(shí)現(xiàn)遠(yuǎn)程更新語(yǔ)音這一技術(shù)。
一、系統(tǒng)組成
1、音頻芯片參數(shù)介紹
該技術(shù)主要通過WiFi/4G模塊與一款音頻解碼芯片(WT2605-24SS)實(shí)現(xiàn),音頻解碼芯片能夠?qū)崿F(xiàn)語(yǔ)音的更新以及存儲(chǔ),WT2605-24SS這款音頻解碼芯片的參數(shù)如下:
2)16 bit DAC音頻解碼器,高達(dá)96dB的SNR。
3)支持音頻均衡器調(diào)整。
4)1個(gè)SPI。
5)1個(gè)IR控制器。
6)1個(gè)SD卡主機(jī)控制器。
7)1個(gè)全速USB2.0 HOST/DEVICE 控制器。
8)一個(gè)全雙工UART,通訊速率高達(dá)1Mbps,主要通過該接口與外部器件進(jìn)行交互。
1.1、DAC參數(shù)介紹:
DAC對(duì)音頻芯片來說是一個(gè)很重要的參數(shù),此款芯片具有16bit 的DAC,也就是DAC的轉(zhuǎn)換精度能夠達(dá)到2的16次方,精度越高,音頻播放的還原度也就越高,當(dāng)然也有24bit DAC的音頻芯片,這類芯片的價(jià)格比較高,一般用于高端的消費(fèi)類電子產(chǎn)品,如HIFI音響等。大部分產(chǎn)品使用16bit的DAC已經(jīng)足夠,性價(jià)比較高,當(dāng)然市面上的音頻芯片DAC特性參差不齊,有9bit,11bit,13bit的DAC,這類芯片的解碼通常都依靠軟件解碼的方式去處理,一般音頻文件大部分都是16bit,將16bit的音頻文件通過軟解碼的方式轉(zhuǎn)為9bit,11bit或13bit的音頻播放,效果可想而知。16bit的DAC直接通過硬件解碼16bit的音頻才能夠達(dá)到最好的效果。
對(duì)于SNR,一般能夠達(dá)到90db的信噪比已經(jīng)有不俗的音質(zhì)表現(xiàn),此款IC高達(dá)96db的SNR,音質(zhì)將會(huì)表現(xiàn)更加出色。
1.2、音頻格式介紹:
此款芯片主要支持mp3格式,當(dāng)然也支持WAV,flac,ape等音頻格式播放,一般主要推薦使用mp3格式音頻,這類音頻資源較多,文件容量較小,大部分場(chǎng)景都能夠滿足,比較通用,WAV,flac,ape等都是無損音頻格式,文件容量都比較大,不太適用于語(yǔ)音更新的場(chǎng)景。
1.3、語(yǔ)音合成介紹:
對(duì)于提示語(yǔ)音,一般可以通過文字合成語(yǔ)音的方式處理,如下:
我們將語(yǔ)音下載下來,用Adobe audition軟件打開音頻看下音頻文件信息:
可以看到合成出來的是16k,16bit的mp3音頻文件,對(duì)于一些應(yīng)用場(chǎng)景,語(yǔ)音合成直接在服務(wù)器端處理即可,這里不做過多介紹。
2、系統(tǒng)框圖介紹:
上圖介紹了遠(yuǎn)程語(yǔ)音更新的具體實(shí)現(xiàn)方式,主要由4G/WiFi設(shè)備連接到服務(wù)器,通過服務(wù)器把音頻數(shù)據(jù)下發(fā),經(jīng)過4G/WiFi設(shè)備中轉(zhuǎn)傳輸?shù)絎T2605組件進(jìn)行保存,文件由WT2605組件進(jìn)行統(tǒng)一管理,更新完成后可直接控制設(shè)備下發(fā)指令進(jìn)行播放。這樣實(shí)現(xiàn)了語(yǔ)音的更新操作,流量也只消耗在音頻數(shù)據(jù)的傳輸上,相比流媒體播放的方式減少了流量消耗,播放卡頓等現(xiàn)象。
1、WT2605與WiFi模塊電路
2、上述電路以WiFi模塊作為主控,WiFi模塊獲取服務(wù)器端下發(fā)的音頻數(shù)據(jù),再通過UART串口傳輸?shù)絎T2605芯片進(jìn)行保存,傳輸完成后直接發(fā)送相關(guān)指令即可控制播放。電路設(shè)計(jì)非常簡(jiǎn)單。
WiFi模塊通過指令,控制WT2605解碼存儲(chǔ)在SPI FLash的音頻數(shù)據(jù),經(jīng)過LM4890功放后播放。這里以1W的功放作為演示,調(diào)節(jié)R6,R7,R8可調(diào)整功放的增益,其他功放根據(jù)具體的芯片手冊(cè)進(jìn)行設(shè)計(jì)。
三、通訊命令格式介紹
通信協(xié)議主要定義主控和 WT2605之間的交互規(guī)則,處理器如何將數(shù)據(jù)推送給WT2605進(jìn)行相應(yīng)的處理,WT2605反饋相應(yīng)的處理結(jié)果。通信數(shù)據(jù)主要以命令幀的方式進(jìn)行,一個(gè)有效的命令幀必須包含:幀頭,命令包長(zhǎng),命令包,校驗(yàn)碼,幀尾等五部分。
幀頭 | 命令包長(zhǎng) | 命令包 | 校驗(yàn)碼 | 幀尾 |
0x7E (1字節(jié)) |
0xXX (1字節(jié)) |
數(shù)據(jù) (N字節(jié)) |
0xXX (1字節(jié)) |
0xEF (1字節(jié)) |
幀頭由1個(gè)固定的十六進(jìn)制數(shù)據(jù)表示,幀類型包含下傳命令幀(模組接收的命令幀)以及上傳命令幀(模組接收數(shù)據(jù)后反饋的命令幀,即ACK或NAK)。
命令包長(zhǎng)表示命令幀除幀頭和幀尾外的字節(jié)數(shù),即命令包長(zhǎng)(1字節(jié))+命令包(N字節(jié))+校驗(yàn)碼(1字節(jié))= N+2 字節(jié)。
命令包是具體的命令,主要包含:命令+參數(shù)。
校驗(yàn)碼,為命令包長(zhǎng)+命令包的和。
名稱 | 長(zhǎng)度 | 說明 |
幀頭 | 1字節(jié) | 定義為十六進(jìn)制的“0x7E” |
命令包長(zhǎng) | 1字節(jié) | 命令幀去除幀頭和幀尾的字節(jié)數(shù),N + 2字節(jié) |
命令包 | N字節(jié) | 命令字 + 參數(shù),詳情參考每條命令的說明 |
校驗(yàn)碼 | 1字節(jié) | 校驗(yàn)和 = [∑(命令包長(zhǎng)+命令包)] & 0xFF |
幀尾 | 1字節(jié) | 定義為十六進(jìn)制的“0xEF” |
WT2605-24SS芯片典型應(yīng)用場(chǎng)景:
1)寵物喂食器、寵物玩具;
2)掃地機(jī);
3)充電樁;
4)語(yǔ)音廣告機(jī);
5)共享自行車、充電寶等。
唯創(chuàng)知音作為一家專注于語(yǔ)音技術(shù)研究的高新技術(shù)企業(yè),始終堅(jiān)持以“服務(wù)好工程師”
為目標(biāo),以行業(yè)語(yǔ)音交互器件標(biāo)準(zhǔn)化為方向,致力于讓復(fù)雜變簡(jiǎn)單,提供快捷的語(yǔ)音、智能
物聯(lián)網(wǎng)應(yīng)用解決方案。
審核編輯:ymf
-
單片機(jī)
+關(guān)注
關(guān)注
6039文章
44574瀏覽量
636326 -
語(yǔ)音芯片
+關(guān)注
關(guān)注
12文章
1764瀏覽量
36583
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論