2018年11月1日,騰訊全球合作伙伴大會(huì),以“開(kāi)放·共生”為主題,在南京開(kāi)幕。聲智科技聯(lián)合創(chuàng)始人兼首席知識(shí)官常樂(lè)受邀出席,并與來(lái)自全球的科技、文化與商業(yè)領(lǐng)域數(shù)百位國(guó)際大咖和萬(wàn)名行業(yè)精英,以及騰訊微信、QQ、騰訊云、騰訊開(kāi)放平臺(tái)、騰訊企鵝號(hào)、騰訊應(yīng)用寶、騰訊AI Lab、騰訊車聯(lián)、騰訊自動(dòng)駕駛、騰訊微瓴互聯(lián)、騰訊動(dòng)漫等業(yè)務(wù)條線的合作伙伴,共商未來(lái)人機(jī)互聯(lián)戰(zhàn)略布局與發(fā)展之道。
聲智科技聯(lián)合創(chuàng)始人兼首席知識(shí)官常樂(lè)表示:“未來(lái),我們將置身于人工智能語(yǔ)音交互時(shí)代,繼續(xù)朝著‘語(yǔ)音即搜索,語(yǔ)言即服務(wù)’方向演進(jìn)。物理世界與數(shù)字世界的有機(jī)融合會(huì)進(jìn)一步加速,日益形成更加智能化的萬(wàn)物互聯(lián)的人機(jī)世界。實(shí)現(xiàn)這一美好智能圖景的關(guān)鍵在于,實(shí)現(xiàn)智能語(yǔ)音交互在更多真實(shí)復(fù)雜場(chǎng)景中的應(yīng)用與落地。聲智科技,自2017年初成為騰訊人工智能生態(tài)合作伙伴以來(lái),依托聲智科技自主研發(fā)的軟硬件一體的遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)勢(shì)能,先后為騰訊打造了騰訊智能音箱、智能車機(jī)系統(tǒng)以及全球首款王者榮耀智能機(jī)器人等產(chǎn)品,助力騰訊深化在家居、車載和機(jī)器人三大領(lǐng)域的人工智能布局與落地。”
全球首創(chuàng)的穿透式遠(yuǎn)場(chǎng)語(yǔ)音交互解決方案
王者榮耀智能機(jī)器人,游戲人物戰(zhàn)神呂布為原型,是國(guó)內(nèi)首款人工智能與游戲結(jié)合的智能機(jī)器人。搭載聲智科技為騰訊獨(dú)家定制的全球首創(chuàng)的穿透式遠(yuǎn)場(chǎng)語(yǔ)音交互解決方案,采用全球首款人偶型音腔結(jié)構(gòu)設(shè)計(jì),由獨(dú)立的人偶和底座兩部分構(gòu)成,底座裝有旋轉(zhuǎn)裝置,人偶可以追隨玩家用戶的聲源,并且旋轉(zhuǎn)定位;通過(guò)獨(dú)家的6麥環(huán)形倒置麥克風(fēng)陣列(Inverse Array)設(shè)計(jì),內(nèi)置穿透式波達(dá)方向估計(jì)(Penetrated DOA),動(dòng)態(tài)聲場(chǎng)的回聲消除(Vibrated AEC)等獨(dú)家定制的AI聲學(xué)算法,成就了具備“聽(tīng)”、“說(shuō)”感知能力的AI游戲達(dá)人——王者榮耀智能機(jī)器人!在騰訊全球合作伙伴大會(huì)上,王者榮耀智能機(jī)器人驚艷亮相展區(qū),為現(xiàn)場(chǎng)觀眾帶來(lái)了真實(shí)不凡的語(yǔ)音交互體驗(yàn)。
(1)6麥環(huán)形倒置麥克風(fēng)陣列(InverseArray)
為了戰(zhàn)斗時(shí),給游戲玩家身臨其境的聽(tīng)覺(jué)享受,王者榮耀機(jī)器人將揚(yáng)聲器設(shè)置于人偶的頭部。區(qū)別于常規(guī)智能語(yǔ)音設(shè)備(比如音箱、機(jī)頂盒)麥克風(fēng)陣列置于頂端、揚(yáng)聲器位于底部的“上聽(tīng)下說(shuō)”且“聽(tīng)說(shuō)一體”的圓柱或立方體的中空音腔結(jié)構(gòu),王者榮耀智能機(jī)器人的麥克風(fēng)陣列設(shè)計(jì)位置只能置于底座,從而形成獨(dú)特的“下聽(tīng)上說(shuō)”且“聽(tīng)說(shuō)分離”的不規(guī)則非中空音腔結(jié)構(gòu)。這樣的結(jié)構(gòu)設(shè)計(jì),也給麥克風(fēng)陣列的結(jié)構(gòu)設(shè)計(jì)與聲學(xué)AI算法適配帶來(lái)了巨大的難度。
同時(shí),為了讓王者榮耀機(jī)器人可以隨時(shí)定位玩家位置,底盤設(shè)置了旋轉(zhuǎn)電機(jī)裝置,電機(jī)極為靠近麥克風(fēng)陣列,當(dāng)人偶被喚醒后進(jìn)行大角度旋轉(zhuǎn)時(shí),會(huì)產(chǎn)生電機(jī)噪音,影響麥克風(fēng)陣列的準(zhǔn)確拾音。
為此,聲智科技為騰訊的王者榮耀機(jī)器人量身研制了“倒置麥克風(fēng)陣列(Inverse Array)”技術(shù)。基于聲智科技定制研發(fā)的6麥環(huán)形的倒置麥克風(fēng)陣列,進(jìn)一步加強(qiáng)麥克風(fēng)陣列的聲音信號(hào)處理能力,對(duì)抗人偶機(jī)器人對(duì)于麥克風(fēng)陣列的遮擋,以及其產(chǎn)生的聲反射和聲衍射的干擾,有效抑制自噪聲和其他外部噪音。在真實(shí)的環(huán)境中,王者榮耀智能機(jī)器人可拾取3-5米遠(yuǎn)場(chǎng)距離聲音,并實(shí)現(xiàn)的360度全方位的語(yǔ)音喚醒與識(shí)別。
(2)穿透式波達(dá)方向估計(jì)(PenetratedDOA)
王者榮耀智能機(jī)器人獨(dú)特的設(shè)計(jì),使人偶身體處在麥克風(fēng)陣列正上方,成為直接障礙物,形成了大量因不規(guī)則外形的人偶身體產(chǎn)生的聲反射和聲衍射,導(dǎo)致了多徑傳播情況的普遍發(fā)生,極大影響了王者榮耀智能機(jī)器人的準(zhǔn)確定位功能。
為了應(yīng)對(duì)這些結(jié)構(gòu)性挑戰(zhàn),進(jìn)一步加強(qiáng)麥克風(fēng)陣列的聲音信號(hào)處理,有效抑制自噪聲和其他外部噪音,提高聲源測(cè)向的準(zhǔn)確度,聲智科技最新研發(fā)了穿透式波達(dá)方向估計(jì)(Penetrated DOA)技術(shù)。即使在噪音干擾大,強(qiáng)混響,強(qiáng)反射面的條件下,王者榮耀智能機(jī)器人可實(shí)現(xiàn)360度全方位的測(cè)向,定位誤差在10度以內(nèi),隨時(shí)響應(yīng)“主公”的呼喚。
(3)動(dòng)態(tài)聲場(chǎng)的回聲消除(VibratedAEC)
傳統(tǒng)智能音箱等產(chǎn)品的設(shè)計(jì)揚(yáng)聲器在底部,而王者榮耀智能機(jī)器人的揚(yáng)聲器位于頭部?jī)蓚?cè),一側(cè)指向性的揚(yáng)聲器為全頻段發(fā)聲器件,承擔(dān)主動(dòng)發(fā)聲功能,另一側(cè)為低頻共振被動(dòng)膜片被動(dòng)發(fā)聲,以達(dá)到較佳的低音效果。而這樣的特殊設(shè)計(jì),導(dǎo)致位于揚(yáng)聲器垂直下方的環(huán)形麥克風(fēng)陣列單元拾取到的揚(yáng)聲器系統(tǒng)自噪聲直達(dá)聲信號(hào)不一致,這無(wú)疑增大了語(yǔ)音喚醒與識(shí)別的難度。
而且,主動(dòng)揚(yáng)聲器的聲音會(huì)干擾麥克風(fēng)陣列進(jìn)行聲源側(cè)向,進(jìn)一步影響人偶旋轉(zhuǎn)角度的準(zhǔn)確性。同時(shí),旋轉(zhuǎn)裝置的電機(jī),極為靠近麥克風(fēng)陣列,當(dāng)人偶被喚醒后進(jìn)行大角度旋轉(zhuǎn)時(shí),產(chǎn)生的電機(jī)噪音影響麥克風(fēng)陣列的拾音。
為此,聲智科技研發(fā)了最新的動(dòng)態(tài)聲場(chǎng)回聲消除(Vibrated AEC)技術(shù),可有效提升音樂(lè)狀態(tài)或語(yǔ)音合成(TTS)狀態(tài)下的喚醒率,以及在5米內(nèi)的噪音環(huán)境下的遠(yuǎn)場(chǎng)語(yǔ)音喚醒和識(shí)別率。搭配聲智科技自主知識(shí)產(chǎn)權(quán)的混響消除、寬場(chǎng)景高靈敏語(yǔ)音喚醒等專屬聲學(xué)AI算法,可在保護(hù)主方向語(yǔ)音不失真的前提下,去除環(huán)境中的語(yǔ)音等非穩(wěn)態(tài)噪聲以及空調(diào)等其他平穩(wěn)噪聲的干擾,自適應(yīng)計(jì)算混響的能量,予以抑制,去除由于房間混響造成的語(yǔ)音拖尾,增強(qiáng)語(yǔ)音清晰度,同時(shí)解決弱參考信號(hào)或者無(wú)參考信號(hào)等復(fù)雜場(chǎng)景中的回聲抵消(自噪聲抑制)問(wèn)題,在雙工語(yǔ)音交互(Double Talk)的情況下仍然魯棒。
所以,王者榮耀智能機(jī)器人在保證高喚醒率的同時(shí),能有力降低誤喚醒率,實(shí)現(xiàn)輕松喚醒,隨時(shí)打斷、隨時(shí)喚醒,無(wú)懼環(huán)境,想說(shuō)就說(shuō),聲隨心動(dòng),為用戶打造完美的遠(yuǎn)場(chǎng)語(yǔ)音交互的體驗(yàn)。
語(yǔ)音交互技術(shù)的創(chuàng)新,只有依托真實(shí)的場(chǎng)景,才能真正釋放技術(shù)的潛能,發(fā)揮技術(shù)的應(yīng)用價(jià)值,推動(dòng)人工智能朝著普惠化方向發(fā)展,讓更多人切實(shí)地感受到科技的智能、快捷與便利。聲智科技,將繼續(xù)堅(jiān)持引領(lǐng)技術(shù)服務(wù)場(chǎng)景的創(chuàng)新路線,攜手生態(tài)合作伙伴,為不同的垂直行業(yè)打造適配多元場(chǎng)景的遠(yuǎn)場(chǎng)語(yǔ)音交互系統(tǒng)方案。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28466瀏覽量
207295 -
人工智能
+關(guān)注
關(guān)注
1791文章
47350瀏覽量
238741 -
語(yǔ)音交互
+關(guān)注
關(guān)注
3文章
286瀏覽量
28025
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論