“少小離家老大回,鄉音無改鬢毛衰。”
方言,不僅是地域風物的承載,更是人與故土聯結的情感紐帶。隨著人們對智能語音需求的越來越多元化,更具鄉土氣息、更具情感聯結的方言語音正成為智能語音合成的熱門方向。
近期,云知聲基于語音合成技術,上線方言合成功能,以 AI 傳遞鄉音鄉情。
1AI遇上方言,“智”取鄉音一片
伴隨普通話的推廣普及,以及城市流動人口的增加,方言正悄悄退出人們的生活,一些地方方言甚至瀕臨失傳的境遇。讓方言走進日常,以更多樣化的形式“活”起來,已成為當前方言保護工作的重中之重。
為助力鄉音傳續,同時也更好滿足人們對智能語音的多樣化需求,云知聲基于最新語音合成深度學習技術,全面學習方言音色、風格,合成貼近真人的“數字鄉音”,讓人工智能的科技溫度浸潤到多個智能語音應用場景——
對智能家居而言,用熟悉的鄉音和用戶對話,既能夠慰藉用戶身居異地的思鄉之情,也有助于打造產品差異化優勢,更好開拓下沉市場;在智能客服領域,很多老人、弱勢群體既不會講普通話,也聽不懂普通話,方言的引入能夠大大減少雙方溝通成本,提高服務效率;直播間里,搞笑幽默的方言既能夠讓直播內容更有趣味性,也迎合了受眾聽鄉音、知鄉情的心理需求,增加了用戶黏性……
2遷移學習,讓方言合成成為現實
讓人工智能“說”出一口普通話已然不易,合成方言更是難上加難。
一直以來,方言合成存在兩大難點:
一是難以獲取大量高質量的語音數據和對應的文本信息,二是不同地區的方言之間相互獨立,在音調、聲母、韻母等方面有所差異,很難進行精確的發音和韻律標注,這無疑增加了數據標注和技術開發的難度。
利用遷移學習技術,云知聲解決了以上問題,得以在短時間內將單個發音人的音色合成粵語、四川話等方言以及英語等外語。
針對部分方言的特性,云知聲先是通過超大規模的高質量普通話數據,訓練得到端到端聲學模型和神經網絡聲碼器等基礎模型;然后,利用較大規模低質量的方言數據對基礎模型進行遷移學習,使其能更好地適應方言的語音特點;最后,使用少量較高質量的方言數據再次對基礎模型進行遷移學習,最終訓練得到方言合成模型。
在遷移學習技術的支持下,云知聲TTS已實現粵語、四川話及純正美音的合成,可覆蓋人機對話、影視配音、直播帶貨等多種場景需求,助力更多客戶實現方言及個性化聲音解決方案的落地。
通過方言合成技術,云知聲數字人也得以開口說“鄉音”,熟練“掌握”多種方言,甚至做到流暢切換。
自由切換多種方言的數字人
除了方言合成,此次,云知聲TTS還上線了rap合成功能,即使用戶五音不全,也能秒變說唱歌手,輕松玩轉freestyle。
從智能家居到呼叫中心,從生活娛樂到辦公學習,云知聲智能語音技術正不斷打破場景限制,讓AI以更豐富的聲音形象融入日常。
目前,云知聲TTS已上線28種發音人音色、64種音色風格,極大程度上滿足了用戶的多場景合成語音應用需求。
面向未來,云知聲TTS將繼續解鎖更多音色、風格,覆蓋更多應用場景,全力滿足客戶的個性化、差異化定制需求。
審核編輯:湯梓紅
-
AI
+關注
關注
87文章
30758瀏覽量
268903 -
語音合成
+關注
關注
2文章
89瀏覽量
16156 -
云知聲
+關注
關注
0文章
179瀏覽量
8388
原文標題:新“聲”報道!云知聲TTS上線方言合成功能
文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論