現在語音交互在車載場景下有哪些應用?痛點在哪些地方?難點在哪些地方?現在面臨哪些挑戰?怎么解決?包括產品設計,諸多的一些想法、問題,我來簡單分享一下幾個觀點,跟各位做一個交流。
我們見了很多的車載的后市場,包括傳統產業轉型,包括互聯網新型智能硬件開發者,像后視鏡、HUD等,現在大家普遍的感覺車載的語音交互是一個大的趨勢,但是依然有一些認為在車載場景下語音的交互還是一個噱頭。主要是因為使用率最廣但漸漸成為調戲工具的SIRI,其次他們擔心在車載場景下的使用語音的安全性。我們認為, SIRI等助手在手機端變成調戲工具,這是一個必然。早期很多助手應用我們語音技術,接入思必馳語音云,通過數據分析發現,很多用戶問的事情是偏帶顏色的,比如問一些AV女優、AV大片名字方便查詢。其次,現在應用語音的車載產品大多只能做到簡單交互,只是為了市場跟風而加上的功能,在產品設計和內容方便明顯存在短板,不夠便捷不夠方便。
開車是非常乏味的事情,因此車載交互也在向趣味性方向發展,比如高德做的林志玲航的導航,我問了一下出租車司機,其中一個司機特別典型,他說我們開車非常悶,林志玲的聲音讓我心里挺激動的,沒有寂寞感。我們現在跟考拉也在做一些個性化的聲音,我們相信有人性化的車載交互會讓語音體驗大幅增加,會讓用戶的黏性大幅提高。林志玲的聲音高德在做了,我相信女孩喜歡聽男神的聲音,我們未來會出很多男神聲音、女神聲音,小孩聲音,個性化的語音合成,這本來也是思必馳的優勢之一。
車載環境的語音交互,更重要的是能提升駕車安全。一般認為,在車載里面的應用操控應該在兩秒之內,其實我覺得兩秒有點長,甚至應該在一秒、零點幾秒,比如在高速上開車,速度是非常快的,如果分神去做操控非常危險。但在設置導航、接聽電話、發微信的時候,緊急情況還是需要去操控它。毫無疑問,語音操控更加安全的。現在車載產品的市場有1.6億,年增量2000萬,但是統計30%的車主在開車的時候是離不開手機的。這很危險。媒體經常曝光拿手機發微信、發微博等等導致車禍。電影《2012》大家都看過,比尼說出“enginestar”啟動了保時捷死里逃生。在科幻電影里面的交互我相信在生活中能全部實現。現在市面上馬上會出現全自然語音交互的車載產品,比如像戰斗機應用的HUD技術,樂駕CEO老馬會跟大家分享他們的HUD產品。
車主到底對智能語音交互接受程度怎么樣?沒有用戶接受,一款產品還是rubbish。騰訊做的一個調研, 76%的用戶對車載智能功能接受度越來越高,全語音控制導航的功能使用占比排第二,僅次于被盜車輛定位,中國太不安全了,小偷太多沒辦法。但即使車輛的定位、被盜的問題我相信未來語音的交互也能解決。比如現在我們汽車還是用鑰匙、用觸摸去開門,未來我們能不能用聲紋,比如說芝麻開門,車能夠識別主人身份,你可以給愛車起名字,你說話汽車就響應,別人說話不好使,這個一定能實現。
另外在汽車前裝市場很多高端車把語音交互系統作為標配,這能引領和培育用戶認知。我個人認為前裝市場還是相對很難進入,而且創新的產品,優秀的體驗還是從后裝做起,包括HUD、行車記錄儀、后視鏡,中控設備。前裝市場的思路相對比較傳統,需要被顛覆,而且驗證周期特別長,像語音驗證周期一般兩三年,甚至三五年,飛馳鎂物很有經驗,他們做了多年傳統前裝。
我們現在提智能語音基本上都認為語音導航,其實不單單是導航,車載語音交互在向其他應用擴展,服務性擴展。回頭看,從2011年智能車載化到現在經過了大概三個階段,傻瓜式1.0,擴展式2.0,和交互式的3.0。在2.0的時候語音控制還是比較低級,在交互式3.0語音需求和功能已經上升第一位,甚至超過了LBS。再一個是相關的應用的服務,內嵌的語音交互在大量拓展,整個車載生態在更繼續發展。
除了導航,其他很多服務和功能都需要語音交互,而且會做的越來越炫、越來越酷。比如收發短信,有些車載智能硬件已經有這個功能,撥打電話,包括小說朗讀,天氣搜索,網絡電臺等等都已經逐步邁入市場。網絡電臺方面,考拉做的很棒,未來我們跟老俞這方面會做的更加炫酷,有的人愿意聽謝霆峰的聲音,那你就可以選謝霆峰的聲音給你讀小說,現在這個技術已經基本成熟,未來你把家人的聲音,比如男朋友、女朋友或者孩子聲音傳上去,自己下載一個語音包,未來你聽小說、聽電臺的內容、聽新聞等等,這些都可以是你愛人的聲音、孩子的聲音,我們目前跟考拉、跟上海交大實驗室都在做這些事情。再一個微信,微信功能也是一個痛點需求,很多車禍就是因為司機在開車的時候收發微信,這一塊怎么做到極致體驗?一定要語音解決,樂駕做HUD“車蘿卜”,已經解決了這個難點。另外,關于未來的拓展我很看好O2O,車載生態不僅僅是解決目前的一些功能,未來能不能我們在搜加油站、停車位、酒店時,像在手機端一樣形成一個閉環,從搜索到導航到支付交易評價。社交,開車的時候我們通過行車記錄儀也好、HUD也好直接給景色拍照,全語音操作,能夠直接分享到微博、微信上。包括聲紋密碼,聲紋密碼不單是解鎖開車,不單是個人支付,我們希望要做到的就是它知道你的身份,知道你的相關的信息,推送的信息都是個性化的,甚至我們通過登陸查酒店的時候它知道你是男女,你的歷史記錄,你的年齡段。這些都是語音交互在車載方面的應用可能。
現在車載智能硬件層出不窮,車機相對來說是挺主流的設備。現在后視鏡市場特別火,行車記錄儀防碰瓷現在也非常流行,OBD目前還比較傳統,車載音箱比如考拉做得很不錯,再包括一些其他的小智能硬件,車載環境里面到底哪一塊屏會占主流?還有一個說法,HUD抬頭顯示系統在戰斗機、高端車里面都有,現在全自然語音交互加手勢式交互的HUD概念已經出來了,比如樂駕的“車蘿卜”,我覺得HUD也有很大可能,撬動未來車載的生態。不管怎么樣,絕對離不開語音交互。
從傻瓜式1.0到語音交互式3.0,從語音導航到其他功能,現已經一步步成為現實。但現在去暢想O2O、聲紋密碼等,語音技術是不是已經能夠直接應用?我覺得還不到時候。語音交互雖然實現了技術上的可能性,但離質的飛躍還有距離。目前的語音只是在載里面加上一個耳朵、一個嘴巴,還缺一個大腦,如何去協調在車載環境下遇到的種種挑戰。
第一,近場抗噪。語音識別在駕車的噪聲環境下怎么樣,人跟車機或者車載智能硬件往往有一段距離,0.3~1米的距離范圍里,噪聲很多,發動機聲噪、路噪、人的說話,音噪等,怎樣抗噪?播放音樂的時候回聲對消我們已經能夠實現,在跟多種車載設備交互下的算法降噪,我們思必馳一直在研發并且目前也有一些還比較滿意的進步。
第二,自然語音交互。這是讓車載生態能夠發展最核心音素,現在車載交互還大多停留在簡單操控階段,簡單控制、簡單命令、簡單搜索、簡單查詢。但如果我們想撬動O2O,一定要首先形成閉環。就像人跟手機的關系,所有的購物、查詢搜索、玩游戲一定會在智能手機完成,不會再跳轉另一個設備上。車載生態起來一定會形成一個閉環,不僅僅是簡單語音交互,一定是自然語言的交互、一定是對話式交互,這個是應用趨勢。思必馳目前一直在努力地,就是真正的對話式人性化語言交互技術。
第三,產品設計層面的邏輯關系。我們智能車載硬件的麥克風、喇叭、結構布局和錄音收音效果的關系,怎么保證抗噪,包括我們語音交互跟后端服務怎么結合。比如語音導航時,能不能跳轉到搜音樂,在導航的時候能不能收發微信等,產品邏輯這是非常大的挑戰。這需要產品開發者和思必馳一起來討論來解決的問題。
(高總此刻給大家放了兩個視頻,一個是春節期間的山東糾正哥的網絡視頻,一個是思必馳最新的可糾正打斷功能的實際演示視頻。涉及到技術曝光,此刻先不做播放。如有興趣的,可關注7月中旬的思必馳新技術發布會。)
這是我們做的一個語音糾正的功能演示。糾正哥遇到的問題我們在車里面的時候經常遇到,在車載噪聲環境下語音識別很難達到百分之百,現在語音交互還是比較差,經常會讓人抓狂,我們就做這批技術,能夠隨時打斷和糾正機器的判斷和識別。我們在7月份會有新技術的大型發布會,到時候會邀請各位朋友參加。目前的語音交互僅僅實現操控、命令,簡單的查詢,這是遠遠不行的,一定是真正的智能語音的技術的進步,才能讓整個生態進來,才能讓整個整個產品體驗帶來質的飛躍。
最后插播小廣告——關于思必馳。我們最早成立劍橋大學,現在拿到兩輪投資,我們專注人機對話,以及語音識別、理解、合成、設備一系列技術,我們把這個技術做成開放解決方案,提供垂直行業像車載、家居、穿戴,包括機器人玩具等等這些行業的開發者,讓他們結成了我們的相關的SDK方案以后提升產品的交互體驗。車載方面我們對芯片廠商、方案廠商,還有車載智能硬件合作伙伴提供我們們相關的技術和方案。
-
導航
+關注
關注
7文章
528瀏覽量
42405 -
智能語音
+關注
關注
10文章
782瀏覽量
48758 -
思必馳
+關注
關注
4文章
284瀏覽量
14282
發布評論請先 登錄
相關推薦
評論