電子發(fā)燒友報(bào)道(文/黃山明)如何去給一個(gè)產(chǎn)品定義是否智能?能夠進(jìn)行計(jì)算,能夠感知外部變化,能夠具備交互能力,簡單來說如果設(shè)備能夠像人一樣,可以思考與交流,并且可以根據(jù)指令幫助我們完成某一個(gè)特定的事情,筆者認(rèn)為便可以稱之為智能產(chǎn)品,而智能汽車亦如是。
從車聯(lián)網(wǎng)到智能座艙,智能汽車技術(shù)正在快速發(fā)展,作為智能的體現(xiàn),使用語音操控是最便捷的交互方式。據(jù)國務(wù)院發(fā)布的《新能源汽車產(chǎn)業(yè)發(fā)展規(guī)劃(2021-2025)》,預(yù)計(jì)2025年新能源汽車銷量將達(dá)到1700萬輛,市場滲透率達(dá)到20%。具體到車載語音市場,據(jù)公開數(shù)據(jù)統(tǒng)計(jì),2020年中國前裝車載語音市場(包含軟硬件)規(guī)模約為17億元人民幣,到2025年,市場規(guī)模將增長至30億元人民幣。
2019-2025年中國汽車智能語音前裝市場規(guī)模預(yù)測|ICVTank
如何讓駕駛員愛上車載語音?
相比按鍵或是觸控方案,車載語音對(duì)于車輛控制,既能避免駕駛員分心,又能提升駕駛員的駕駛體驗(yàn)。同時(shí),車載語音作為連接車聯(lián)網(wǎng)的入口,就如同當(dāng)年的智能音箱一樣,受到了眾多企業(yè)的關(guān)注。但與智能音箱相比,由于車輛的使用環(huán)境、用戶群體的不同,對(duì)語音系統(tǒng)提出了更嚴(yán)苛的要求。
一個(gè)很突出的問題是,據(jù)筆者詢問過幾位新能源智能汽車車主表示,在體驗(yàn)過幾次車載語音后,便表示不會(huì)再用這一功能。究其原因,主要在于用戶體驗(yàn)不佳,反應(yīng)遲鈍,無法正確理解車主的需求等。
為此,電子發(fā)燒友帶著這些疑惑采訪到了清微智能CEO王博,他認(rèn)為問題主要出在用戶體驗(yàn)上。首先是習(xí)慣性問題,通過語音來控制并非是許多駕駛者的第一反應(yīng);第二則是技術(shù)問題,一個(gè)指令發(fā)出去,兩三秒之后才反應(yīng),很難說是一個(gè)很好的體驗(yàn),而且在目前的網(wǎng)絡(luò)環(huán)境下,一些特殊場景中,可能無法聯(lián)網(wǎng)進(jìn)行使用;除此之外的網(wǎng)絡(luò)傳輸信息泄密等安全問題也需要考慮。
聲揚(yáng)科技合伙人及產(chǎn)品VP謝基有對(duì)電子發(fā)燒友記者表示,從技術(shù)角度來看,想要讓車載語音擁有一個(gè)好的用戶體驗(yàn),需要在幾個(gè)方面上改進(jìn),一個(gè)是在車內(nèi)環(huán)境中如何精準(zhǔn)獲取用戶的聲音,但車內(nèi)環(huán)境復(fù)雜,存在車噪、風(fēng)噪等噪音,以及各種聲波反射后的混響,想要獲得精準(zhǔn)人聲比較困難;另一個(gè)則是語音的識(shí)別率,當(dāng)車載語音多次無法準(zhǔn)確識(shí)別駕駛員的語音指令時(shí),自然就不會(huì)再用了。
語音識(shí)別原理圖
針對(duì)這些問題,聲揚(yáng)科技也聯(lián)合了ADI進(jìn)行相關(guān)合作,在其芯片上集成同聲分離的算法,能夠在兩個(gè)人同時(shí)說話時(shí),將各自的聲音區(qū)分開來進(jìn)行識(shí)別。
當(dāng)兩人以上同時(shí)說話時(shí),單點(diǎn)的音節(jié)無法分辨,因?yàn)檫@兩個(gè)聲音在物理形態(tài)上處于疊加,聲波疊加后可能變成第三種聲音。汽車環(huán)境中,可以采用多麥克風(fēng)陣列的方式將聲音進(jìn)行收集。再進(jìn)行同聲分離,分離出不同音區(qū)的聲音,后續(xù)再用算法進(jìn)行降噪和去混響。
而在降噪方面,尤其是在車窗開啟時(shí),噪聲極大。許多汽車在車內(nèi)的吸音并不一定做的很好,這種情況下車內(nèi)的噪聲,對(duì)于語音識(shí)別帶來極大挑戰(zhàn)。聲揚(yáng)科技在這些方面都有較為豐富的技術(shù)積累,同時(shí)也與ADI等企業(yè)合作進(jìn)行技術(shù)攻關(guān)。
至于語義的理解,目前而言已經(jīng)發(fā)展較為成熟。只要前端做的足夠好,對(duì)于后端而言壓力會(huì)減輕許多。聲揚(yáng)科技在車內(nèi)場景針對(duì)數(shù)字的識(shí)別準(zhǔn)確率可以達(dá)到99%以上,對(duì)于非固定內(nèi)容的識(shí)別率也保持在90%以上。
當(dāng)車載語音能夠切實(shí)幫助駕駛員解決實(shí)際問題,精準(zhǔn)接收并執(zhí)行駕駛員的指令,減少注意力的分散,提升駕駛體驗(yàn),這樣才能得到真正廣泛的應(yīng)用。而在目前,車載語音仍處于較為初級(jí)的階段,許多功能正在快速迭代,這也推動(dòng)著車載語音滲透率的進(jìn)一步增長。
離線語音算法僅KB級(jí) 對(duì)廠商提出高要求
據(jù)水木清華研究中心數(shù)據(jù)顯示,2019年,中國乘用車車載語音裝配率為48.8%;2020年1-9月,裝配率已經(jīng)提升至64.8%。從市場競爭格局來看,據(jù)中泰證券數(shù)據(jù)顯示,2020年1-4月,科大訊飛和Cerence占據(jù)83%份額,百度、思必馳、傲碩、阿里云等企業(yè)緊隨其后。
2020年1-4月國內(nèi)語音識(shí)別供應(yīng)商裝機(jī)量統(tǒng)計(jì)|中泰證券
在進(jìn)行語音識(shí)別的過程中,車輛可能需要處于聯(lián)網(wǎng)狀態(tài)當(dāng)中,這就對(duì)車路協(xié)同、大數(shù)據(jù)、移動(dòng)網(wǎng)絡(luò)有一定的要求,而在車內(nèi)的應(yīng)用場景中,用戶使用車載語音希望能夠得到即時(shí)的反饋,如調(diào)整座椅、控制空調(diào)等,這些簡單且固定的命令可以交由本地去做。
王博認(rèn)為,目前階段,車載語音主要用來人對(duì)車的一些簡單的操作,語義相對(duì)簡單和有限,離線的方案還是比較適合的。另外,隨著算法的演進(jìn)和優(yōu)化,以前在云端的模型,現(xiàn)在完全可以放在車機(jī)端使用。只要讓車機(jī)具備更新語音模型的能力,就能讓離線方案也獲得不錯(cuò)的用戶體驗(yàn)。
清微智能的車載離線語音模塊無需聯(lián)網(wǎng),減少了網(wǎng)絡(luò)通信的延遲,可打造真正的“無縫”連接,讓系統(tǒng)快速響應(yīng);同時(shí)針對(duì)駕車環(huán)境,清微方案配備車噪降噪算法;另外,可重構(gòu)計(jì)算技術(shù)帶來的芯片靈活性可方便集成客戶自有算法,提升駕駛者的使用體驗(yàn)。
目前而言,由于通信基礎(chǔ)設(shè)施還未完全覆蓋所有應(yīng)用場景,如地下停車場中,由于信號(hào)較差,導(dǎo)致聯(lián)網(wǎng)功能在一定程度上無法使用,造成用戶體驗(yàn)下降。為此,聲揚(yáng)科技也提供了相應(yīng)的離線解決方案,在使用聲紋識(shí)別時(shí),可以通過離線方式來判斷駕駛員的身份。
謝基有表示,未來可能隨著5G的發(fā)展,對(duì)于信號(hào)覆蓋會(huì)有一定提升,使用云端服務(wù)會(huì)更加便捷,但并非所有場景都能夠被信號(hào)覆蓋。一個(gè)很顯著的例子是,盡管4G網(wǎng)絡(luò)發(fā)展多年,但在許多地點(diǎn),如地下停車場時(shí),信號(hào)仍然非常差,因此離線在某些場景中仍然是必須的。
此外,離線方案需要在CPU中運(yùn)行,單靠MCU無法承載。即便是CPU,也需要進(jìn)行深度的優(yōu)化及定制,還需要考慮到一些芯片無法進(jìn)行浮點(diǎn)運(yùn)算,則需要再做浮點(diǎn)程序定點(diǎn)化操作。但這些芯片中所預(yù)留的RAM僅有KB級(jí),如聲揚(yáng)科技在ADI的DSP芯片上運(yùn)行整個(gè)算法,僅用了150KB左右,這就對(duì)于供應(yīng)商廠家技術(shù)提出了更高的要求。
聲紋識(shí)別解決安全問題 算法解決數(shù)據(jù)難題
車載語音除了幫助駕駛員解放雙手,減少注意力的分散,更多的是為駕駛員提供一種更為舒適的駕駛體驗(yàn),提高對(duì)整輛車的掌控感。但車載語音的出現(xiàn)也帶來了一個(gè)問題,當(dāng)車內(nèi)并非只有一人時(shí),其他人如果也通過語音來控制車輛,如行駛過程中打開后備箱、打開車門等,反而會(huì)對(duì)駕駛造成一定的安全隱患。
對(duì)此,謝基有表示,聲揚(yáng)科技非常擅長的一個(gè)領(lǐng)域便是聲紋識(shí)別,可以判斷出哪些語音是車主本人所說的,哪些是其他人說的話。通過聲紋判定了身份也就確認(rèn)了是否有進(jìn)行該操作的權(quán)限,從而解決上述問題。聲揚(yáng)科技也與國內(nèi)的一些汽車品牌進(jìn)行合作,當(dāng)行車過程中靠近某個(gè)景點(diǎn),提示是否需要購買門票時(shí),可以設(shè)定只有具備權(quán)限的人,才能完成確認(rèn)進(jìn)行購買支付的操作。
并且聲紋識(shí)別也可以進(jìn)行活體檢測,通過語音圖譜,可以清楚的辨別是否是真人在現(xiàn)場說話,還是通過錄音回放甚至是通過語音合成的方式進(jìn)行通話,這種聲紋鑒定技術(shù)也被應(yīng)用在了防電話詐騙等安防領(lǐng)域。
當(dāng)然,眾所周知,做聲紋識(shí)別等生物識(shí)別技術(shù)時(shí)需要使用到大量的數(shù)據(jù),幫助企業(yè)進(jìn)行技術(shù)的迭代,但許多語音廠商拿不到主機(jī)廠的數(shù)據(jù),主機(jī)廠沒有沒有語音廠商的技術(shù),又不愿意分享車內(nèi)數(shù)據(jù)以提升產(chǎn)品功能,因此很難實(shí)現(xiàn)有效連接。而語音如要發(fā)揮最大優(yōu)勢(shì),還應(yīng)該與車控以及V2X部分進(jìn)行連接。但是主機(jī)廠在這方面也對(duì)語音廠商有限制,因?yàn)槿绻B接的話會(huì)增加主機(jī)廠的風(fēng)險(xiǎn)。
謝基有表示,V2X有兩種數(shù)據(jù),一部分是車輛本身的行駛數(shù)據(jù),如車速等;另一部分則是語音的數(shù)據(jù),而語音廠商目前只需要語音數(shù)據(jù)去完成算法性能的提升,其實(shí)并不需要大量的數(shù)據(jù),可以在應(yīng)用過程當(dāng)中通過自動(dòng)學(xué)習(xí)來進(jìn)行迭代。
同時(shí),在應(yīng)用之前,聲揚(yáng)科技也會(huì)通過其他場景中的語音數(shù)據(jù),來優(yōu)化算法,盡管與車內(nèi)環(huán)境場景不同,但在人物的聲紋特征上是一致的,通過降噪等算法,讓應(yīng)用環(huán)境差異變得更小,也更適用于車內(nèi)的場景。因此可以認(rèn)為,聲揚(yáng)科技的算法具有較好的普適性及獨(dú)創(chuàng)性。
5%到20% 新能源汽車帶動(dòng)車載語音快速發(fā)展
據(jù)中汽協(xié)發(fā)布的《2021年中國汽車市場預(yù)測報(bào)告》顯示,預(yù)計(jì)2020年全年汽車總銷量將達(dá)2530萬輛,其中新能源汽車銷量約達(dá)130萬輛,占比約為5.14%。而中國推出的《新能源汽車產(chǎn)業(yè)發(fā)展規(guī)劃》從政策層面明確提出,到2025年我國新能源汽車銷量將占總銷量的20%,顯然未來幾年,新能源汽車還有巨大的發(fā)展機(jī)遇。
而新能源汽車的快速發(fā)展,也將帶動(dòng)車載語音的快速滲透。謝基有認(rèn)為,新能源汽車代表著造車新勢(shì)力,他們對(duì)于新技術(shù)的接受程度會(huì)更高,并且新能源汽車一個(gè)很大的亮點(diǎn)就是智能,除了ADAS智能輔助駕駛系統(tǒng)外,智能座艙也是也是其中重要的一環(huán),而車載語音便是與智能座艙緊密結(jié)合。
在過去幾年,汽車中車載語音大多在后裝市場,許多傳統(tǒng)車企對(duì)于新技術(shù)的接受程度較低,想要說服這些企業(yè)在前裝便把語音系統(tǒng)加入進(jìn)去較為困難,因此只能采用后裝的方式,這時(shí)候就出現(xiàn)了如智能后視鏡、智能中控等技術(shù)。
不過目前有一個(gè)趨勢(shì),車載語音正在向前裝市場滲透,隨著新能源汽車的快速發(fā)展,對(duì)于車載語音具有極大的推動(dòng)作用。聲揚(yáng)科技也表示,會(huì)持續(xù)在兩個(gè)方面進(jìn)行發(fā)力,一個(gè)是前端語音信號(hào)的處理,如何去解決源頭的問題;二是解決安全性問題,通過聲紋識(shí)別,如何在操作控制過程當(dāng)中將安全性做好。
能夠看到,在這個(gè)市場中,匯集了許多互聯(lián)網(wǎng)大咖,對(duì)于這些巨頭而言,需要做完整的智能生態(tài),因此車載語音這一塊自然也不會(huì)放過。但并不代表BAT這些巨頭做了生態(tài)之后,其他企業(yè)就沒有機(jī)會(huì)了。車載語音包含了太多的技術(shù)點(diǎn),而每一個(gè)技術(shù)都能夠產(chǎn)生巨大的市場空間。
就如同王博所提到的那樣,車載語音場景為駕駛員帶來更大的安全性,而語音交互也并非新的技術(shù),最后必然會(huì)成為一種標(biāo)配,隨著網(wǎng)絡(luò)速度和技術(shù)的發(fā)展,帶來的無非是駕駛者對(duì)其依賴的程度逐漸加深,從目前的可有可無變?yōu)檎嬲男枨蟆?br />
本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請(qǐng)注明以上來源。如需入群交流,請(qǐng)?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請(qǐng)發(fā)郵箱huangjingjing@elecfans.com。
-
人機(jī)交互
+關(guān)注
關(guān)注
12文章
1207瀏覽量
55412 -
新能源汽車
+關(guān)注
關(guān)注
141文章
10553瀏覽量
99596 -
語音識(shí)別
+關(guān)注
關(guān)注
38文章
1742瀏覽量
112690 -
人工智能
+關(guān)注
關(guān)注
1791文章
47344瀏覽量
238728 -
車載語音
+關(guān)注
關(guān)注
0文章
19瀏覽量
10375
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論