語(yǔ)音合成(TTS)技術(shù)作為人工智能領(lǐng)域的一項(xiàng)重要技術(shù),已經(jīng)深入大眾生活,無(wú)孔不入。通過(guò)將文字轉(zhuǎn)化為生動(dòng)自然的語(yǔ)音輸出,為人們的生活帶來(lái)了許多便利。
啟英泰倫離線語(yǔ)音合成技術(shù)基于啟英泰倫自研智能語(yǔ)音芯片,可以在無(wú)網(wǎng)環(huán)境下,將文本快速合成聲音,提供流暢自然、穩(wěn)定一致的合成體驗(yàn)。
該技術(shù)方案具有以下特點(diǎn):
01高度自定義
單次可合成文本4K字節(jié),即2000個(gè)漢字左右。同時(shí),支持語(yǔ)速、語(yǔ)調(diào)、音量調(diào)節(jié),包含多種音色和情緒,如知性女聲,渾厚男聲等,音色自然,風(fēng)格多樣化。另推出數(shù)十種特色鈴聲,如警報(bào)聲、滴答聲等。用戶可以根據(jù)具體需求進(jìn)行靈活調(diào)整,以滿足不同場(chǎng)景和用戶要求。
02智能分析
具備文本智能分析處理功能,對(duì)常見(jiàn)的數(shù)值、電話號(hào)碼、時(shí)間日期、度量衡符號(hào)等格式進(jìn)行文本自動(dòng)處理,可實(shí)現(xiàn)多音字、數(shù)字、數(shù)值、日期、時(shí)間、字母正確流暢的合成。
03控制靈活
支持多種控制命令,包括開(kāi)始合成、停止合成、暫停合成、恢復(fù)合成、狀態(tài)查詢等,讓語(yǔ)音合成功能更靈活。
離線語(yǔ)音合成技術(shù)可應(yīng)用于故事機(jī)、排隊(duì)叫號(hào)、交通站點(diǎn)(機(jī)場(chǎng)/火車(chē)站/地鐵)、考勤機(jī)、客服機(jī)、自動(dòng)售貨機(jī)等領(lǐng)域。
語(yǔ)音合成技術(shù)將“眼睛看”轉(zhuǎn)變?yōu)椤岸渎?tīng)”,給人們生活帶來(lái)了更加智能化的體驗(yàn)。啟英泰倫即將推出中英混合合成模型,并開(kāi)發(fā)語(yǔ)音合成個(gè)性化定制。未來(lái)將繼續(xù)深耕語(yǔ)音合成技術(shù),為用戶帶來(lái)更自然、更逼真的交流體驗(yàn)。
-
芯片
+關(guān)注
關(guān)注
455文章
50714瀏覽量
423154 -
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238260 -
語(yǔ)音合成
+關(guān)注
關(guān)注
2文章
89瀏覽量
16156
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論