小米的聲學語音技術目前已經實現全面自研,并在自研部分領域持續領先,聲學語音技術已迎來全新時代。
據了解,小米聲學語音的 4 項技術實現了業內突破,分別是語音交互實現“情感化”、AIoT 放音技術升級、就近喚醒全新升級、兩麥陣列喚醒新策略。
語音交互實現“情感化”:小米 AI 實驗室在“情感數據量有限”的前提下,通過不同聲學模型、不同聲碼器組合最終上線自然、擬人效果的情感 TTS(Text to speech,人工語音合成),成為業內首家情感化 TTS 大規模落地的企業。
此次小米小愛同學 Art 全面支持情感化語音交互,基于有限但類型不同的情感音頻數據(如開心、關心、害羞、驚訝等),通過不同技術訓練并迭代聲學模型,最終支持情感 TTS 合成并實現“小愛同學”音色情感化、擬人化。未來,小米語音將升級此技術——支持情感 TTS 實時合成。
AIoT 放音技術升級:首次實現一句話全屋同步播放相同音頻功能。據悉,小米小愛音箱 Art 是首款可以實現語音支持全屋播放的設備。用戶直接對小愛同學說“全屋播放 XXX”,無需提前在 App 端進行手動設置,即可實現一句話語音交互。
就近喚醒全新升級:業內首次上線跨設備關閉鬧鐘功能。此次小米小愛音箱 Art 就近喚醒全新升級,可支持跨設備關閉鬧鐘。遠處的音箱鬧鐘響了,喚醒近處的音箱可以直接關閉遠處的鬧鐘。此功能在業內首次上線,小米小愛音箱 Art 也是首款支持該功能的產品。
兩麥陣列喚醒新策略:兼顧低功耗與高性能,高效降噪,獲得干凈人聲。小米小愛音箱 Art 同步支持兩麥陣列喚醒技術。在麥克風陣列方面,小米采用兩麥盲源分離降噪前端,通過盲源分離、降噪、回聲消除等技術,在多聲源的嘈雜環境、音箱自身播放音樂時,都能結合語音增強技術,消除噪音的強干擾,獲得干凈、準確的人聲音頻。
-
音箱
+關注
關注
36文章
641瀏覽量
67925 -
AI
+關注
關注
87文章
31364瀏覽量
269770 -
小米
+關注
關注
70文章
14380瀏覽量
144592
發布評論請先 登錄
相關推薦
評論