湯兵城,思必馳商務(wù)拓展總監(jiān),是《電器》記者在過去三年中,采訪這家公司的第四人。可以說,從思必馳堅持To B并轉(zhuǎn)型至專注智能硬件領(lǐng)域以來,在資本市場每一次獲得青睞,與阿里智能、慶科、綠聯(lián)等生態(tài)伙伴的每一場合作,筆者幾乎沒有缺席。這期間,思必馳經(jīng)歷了移動互聯(lián)的風(fēng)口、語音交互技術(shù)的升級以及團(tuán)隊人員的完善,從2014年至今,面向智能車載、智能家居和智能機(jī)器人三大垂直領(lǐng)域,為其提供自然語言交互解決方案的思必馳,被業(yè)內(nèi)成為可與科大訊飛二分天下的語音巨頭。
圖1 思必馳商務(wù)拓展總監(jiān)湯兵城
2017年3月10日,在中國家電及消費電子博覽會期間,思必馳商務(wù)拓展總監(jiān)湯兵城做客《電器》雜志專訪間,從2016年云棲大會YunOS@Home專場談起,詳解伴隨三大板塊提升,思必馳是如何引領(lǐng)人性化智能語音交互技術(shù)。
獨家AIOS,奠定優(yōu)勢基礎(chǔ)
談起公司在三大垂直領(lǐng)域的發(fā)展,可以用強(qiáng)勁二字來形容。據(jù)湯兵城介紹,在車載后裝市場,思必馳與阿里旗下的高德地圖合作已久,Yun OS全線產(chǎn)品所搭載的語音系統(tǒng)都是思必馳提供。在Android系統(tǒng)方面,與IME、瑞聯(lián)、天之眼等都保持密切合作。在車載后裝市場奠定基礎(chǔ)的同時,思必馳加速前裝市場,如今與奇點汽車、小鵬汽車等互聯(lián)網(wǎng)造車企業(yè)已經(jīng)進(jìn)入后期調(diào)整。在家居方面,與阿里、騰訊、小米、聯(lián)想、海爾、美的等建立合作關(guān)系,推出的產(chǎn)品包括電視、音箱、OTT盒子等。在智能機(jī)器人方面,與大華樂橙、360等中高端品牌合作密切。擅長唱歌跳舞的小蘿卜機(jī)器人、智能程度頗高的大華樂橙小樂機(jī)器人、360小巴迪機(jī)器人等都已經(jīng)推向市場。
圖2 慶科VBS6100AI芯片模組
專注細(xì)分領(lǐng)域是成功的關(guān)鍵,但技術(shù)積累必不可少。能夠在這三大領(lǐng)域保持自然語言交互解決方案商的領(lǐng)先地位,與思必馳在2015年推出的對話操作系統(tǒng)AISpeech Operating System(簡稱:AIOS)密不可分。據(jù)湯兵城介紹,源于英文縮寫的AIOS相當(dāng)于思必馳的獨家系統(tǒng),它可運行于主流操作系統(tǒng)(Linux, Android,QNX)之上,封裝核心的語音相關(guān)技術(shù)和對話交互邏輯,同時對上層應(yīng)用制定了一層領(lǐng)域抽象接口,支持快速集成和自定義開發(fā)。他說,思必馳把語音相關(guān)技術(shù)整合成AIOS 人機(jī)對話操作系統(tǒng),作為安卓系統(tǒng)之上的一層標(biāo)準(zhǔn)接口,提供給硬件合作伙伴,能夠極大減少開發(fā)及維護(hù)成本。針對不同場景,AIOS又分成了AIOS for Car,AIOS for Home,AIOS for Robot等版本,而這些版本成為日后思必馳發(fā)力三大板塊的基礎(chǔ)。
創(chuàng)新模式,成就語音交互獨角獸
雖然AIOS成為很多語音創(chuàng)業(yè)公司效仿的重點,但對系統(tǒng)的重視程度難以和思必馳相提并論。據(jù)湯兵城介紹,公司會根據(jù)不同的系統(tǒng)量身打造AIOS,強(qiáng)調(diào)語音識別、語音合成、語義理解、聲紋識別、對話管理、音頻分析等技術(shù)的定制化處理,并且對接了豐富的第三方內(nèi)容資源,比如酷我音樂、蝦米音樂、大眾點評以及股票天氣、故事讀物、笑話大全等。這一整套下來,正是湯兵城眼中人工智能語音交互的重要組成部分。
圖3 小米生態(tài)鏈諸葛小明床頭燈
作為人工智能重要的組成部分,湯兵城強(qiáng)調(diào),思必馳從頭至尾都會把更多的精力聚焦在語音交互的體驗上。湯兵城進(jìn)一步解釋說,公司做語音識別起家,相比其他人工智能公司更加專注,思必馳的聯(lián)合創(chuàng)始人俞凱是劍橋的語音博士,現(xiàn)在是上海交大教授,所以公司在自然語言處理技術(shù)等方面也更專業(yè)。此外,同科大訊飛一樣,思必馳具有全套語音技術(shù)產(chǎn)權(quán),并成功實現(xiàn)了“產(chǎn)學(xué)研”結(jié)合,雄厚的技術(shù)積累也是的思必馳在系統(tǒng)上迭代升級非常快。相比其他語音創(chuàng)業(yè)公司,思必馳更專注在智能硬件在具體場景的語音交互。據(jù)悉,思必馳和上海交通大學(xué)建立了智能人機(jī)交互聯(lián)合實驗室,并達(dá)了完善的獨家知識產(chǎn)權(quán)協(xié)議。另外,B2B2C的商業(yè)模式與其他公司也有不同。
圖4 車蘿卜HUD
據(jù)了解,AIOS已經(jīng)成為中國智能車載后裝市場中占有率最大的語音解決方案,占有率達(dá)到60%左右。采用這款系統(tǒng)的車載產(chǎn)品包括了著名的捷渡“遠(yuǎn)界”智能后視鏡、祖師匯云龍智能后視鏡、天之眼智能后視鏡、車蘿卜HUD等,是當(dāng)之無愧的獨角獸。
環(huán)形“6+1”遠(yuǎn)場麥克風(fēng)陣列,提高交互體驗
提高用戶體驗,是湯兵城在采訪中提到最多的幾個字,他舉例說,家居環(huán)境下的噪音有混響、回聲、背景噪音、人聲干擾等多種類型,此外遠(yuǎn)距離交互也是語音交互領(lǐng)域要解決的一個難點。在噪聲干擾或者距離稍微遠(yuǎn)的環(huán)境下,即使是優(yōu)質(zhì)的語音軟件方案也不能得到好的交互效果。針對這個問題,在AIOS軟件方案之外,思必馳研發(fā)了一個軟硬一體化的解決方案,那就是環(huán)形“6+1”遠(yuǎn)場麥克風(fēng)陣列,屬于數(shù)字信號處理范疇,6個麥克風(fēng)呈環(huán)形均勻分部拾音,中間1個麥克風(fēng)輔助拾音。陣列獲取聲音信息之后,利用拾音波束成形,采用獨特算法,抑制波束之外的噪聲,并融合語音信號信息,從含噪聲的語音信號中提取出純凈語音,增強(qiáng)說話人語音。從而可以確定信號來波方向,達(dá)到抗噪目的的同時,還增強(qiáng)了人的聲音。
圖5 樂橙小樂育兒機(jī)器人
據(jù)了解,用“環(huán)形6+1遠(yuǎn)場麥克風(fēng)陣列”對聲音信息進(jìn)行處理之后,智能設(shè)備可以做到5米遠(yuǎn)場交互(準(zhǔn)確率達(dá)到92%)、360°全角度環(huán)形拾音、聲源定位精確度控制在±10°以內(nèi)。“該陣列為國內(nèi)首款同類產(chǎn)品,大大增強(qiáng)了降噪處理和遠(yuǎn)場識別,再結(jié)合豐富的后端第三方資源,提高了交互體驗。”湯兵城表示,“目前,思必馳的“環(huán)形6+1遠(yuǎn)場麥克風(fēng)陣列”主要針對的是智能機(jī)器人和智能音箱等設(shè)備,未來會在更多家電產(chǎn)品上應(yīng)用。”
迭代升級,滿足更多客戶需求
用戶通過各類硬件、家電的使用調(diào)用思必馳的云端,每天都會產(chǎn)生海量數(shù)據(jù)。憑借這些,首先可以進(jìn)一步優(yōu)化、訓(xùn)練聲學(xué)模型,使得聲音識別率無限逼近于百分之百。其次,通過數(shù)據(jù)分析,可以挖掘一些新的商業(yè)模式。當(dāng)然這些需要過程,眼前對思必馳而言重要的做到專注與聚焦,以及提升用戶的體驗。
圖6 聯(lián)想智能音箱
沒有時間考慮行業(yè)競爭與抄襲,思必馳正忙于拓展新領(lǐng)域。在本次AWE上,思必馳展示了聯(lián)想在CES發(fā)布的智能音箱,其海外版搭載亞馬遜Alexa平臺,國內(nèi)版則采用了思必馳自然語言交互方案,能夠?qū)崿F(xiàn)流暢的語音交互,涵蓋音樂播放、新聞、有聲讀物、查詢天氣、語音叫車、訂外賣等服務(wù),是用戶的貼心助理。
此外,小米互聯(lián)網(wǎng)音箱、與慶科聯(lián)手打造的VBS6100AI語音模組,搭載了思必馳ASR、TTS等語音技術(shù)的方案,具備語音交互功能,高度集成了多方技術(shù)優(yōu)勢。還有聲必可語控背景音樂系統(tǒng)、樂橙TC5S人工智能攝像機(jī)、樂橙小樂育兒機(jī)器人、諸葛小明床頭燈以及美的洗衣機(jī),海爾馨廚冰箱等產(chǎn)品。
-
智能家居
+關(guān)注
關(guān)注
1928文章
9553瀏覽量
184938 -
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238255 -
智能車載
+關(guān)注
關(guān)注
0文章
57瀏覽量
9087
發(fā)布評論請先 登錄
相關(guān)推薦
評論