亞馬遜網(wǎng)絡(luò)服務公司(Amazon Web Services Inc.)正在接管Google LLC的人聲復制功能,今天為亞馬遜波利(Amazon Polly)添加了兩項新功能,這是一項基于云的服務,可將文本轉(zhuǎn)換為逼真的語音,并用于創(chuàng)建可以通話的應用程序。
新功能的第一個功能稱為“神經(jīng)文本語音轉(zhuǎn)換”,亞馬遜表示,通過增強合成語音的“自然度”和“表達力”,可以在語音質(zhì)量上“顯著改善”。
關(guān)于神經(jīng)文本語音轉(zhuǎn)換的一大優(yōu)點是,由于亞馬遜去年在研究論文中提到的一種新的人工智能模型,它只需訓練幾個小時就可以學習新的口語風格。該模型通過將大量標準的中性語音與僅幾個小時的目標語音風格的其他語音數(shù)據(jù)相結(jié)合而起作用。可以根據(jù)需要添加新的補充數(shù)據(jù),以創(chuàng)建各種其他語音樣式。
AWS傳福音者朱利安·西蒙(Julien Simon)在博客中寫道,使用Neural-Text-To-Speech的基本算法,亞馬遜創(chuàng)建了第二個新功能,這是新聞播音員式的聲音,使敘事聲音在閱讀新聞和類似內(nèi)容時“更加逼真”。發(fā)布。
西蒙說:“語音質(zhì)量當然很重要,但是要使合成語音更加逼真和引人入勝,還可以做更多的工作。” “風格呢?可以肯定的是,人耳可以分辨出新聞廣播,體育廣播,大學課程等之間的區(qū)別;實際上,大多數(shù)人在正確的環(huán)境中采用正確的言語風格,這無疑有助于傳達他們的信息。”
西蒙說,包括《環(huán)球郵報》,《大不列顛百科全書》和TIM Media在內(nèi)的組織已經(jīng)在使用Polly的新聞廣播員風格。該功能也已引入到支持Amazon Alexa的設(shè)備中,該設(shè)備用于敘述每日新聞簡報和類似內(nèi)容。
-
人工智能
+關(guān)注
關(guān)注
1792文章
47377瀏覽量
238881 -
模型
+關(guān)注
關(guān)注
1文章
3255瀏覽量
48905 -
亞馬遜
+關(guān)注
關(guān)注
8文章
2669瀏覽量
83430
發(fā)布評論請先 登錄
相關(guān)推薦
評論