2012年,蘋果推出了語音助手服務(wù)Siri,其它的廠商也是跟隨蘋果的腳步,紛紛推出了語音助手,包括三星的Bixby、Google Assistant、微軟小娜、小米的小愛同學、vivo的jovi等等,各大廠商都紛紛為手機配備了AI語音助手,同時也在努力讓語音助手能實現(xiàn)更是各樣的功能。今年我們所熟知的三星Galaxy S9+、華為P20 Pro、小米8、vivo NEX、OPPO Find X等旗艦產(chǎn)品上都配備了AI語音助手,甚至很多千元機都具備語音助手,AI語音助手也成為手機廠商非常用心去跟隨的一個風口。但從用戶的角度來看,又有幾個人真的認真的使用過手機語音助手呢?至少現(xiàn)在看,它還是一個可有可無的雞肋功能。
普及率與其使用率不成正比
7月份的時候,國外的一家市場研究公司發(fā)布了最新報告預(yù)測,在2018年出售的智能手機中,將會超過47.7%的智能手機配置AI語音助手,作為參考,去年這個數(shù)字為36.6%。從年初到現(xiàn)在筆者也由于工作的原因接觸到了今年的很大一部分手機產(chǎn)品,確實其中搭載語音助手的產(chǎn)品越來越多。依賴智能手機的數(shù)量,語音助手的普及率看起來確實不低了,但問題是,普及率和使用率又是另一回事了。
在2017年Gartner的調(diào)查中顯示,Siri 等人工助理的應(yīng)用使用率僅為35%,這對于目前已經(jīng)幾乎人手一部的手機來說并不算是出色的數(shù)據(jù)。MIUI官方也曾在微博上發(fā)起過相關(guān)投票,從結(jié)果上看,5次以下的占了84.4%,我覺得如果放一個0次的選項的話,估計投票的人也不會少。另一方面,能在微博上參與投票的用戶大都也都比較關(guān)注互聯(lián)網(wǎng),對“語音助手”的了解也相對較多,即便如此其使用率依舊不樂觀,要是在普遍性更強的用戶中進行調(diào)查的話,其使用率表現(xiàn)可能會更低。
功能雖多但使用場景很有限
從無到有確實很容易打動消費者,但是如何精進一項技術(shù),是非常具有挑戰(zhàn)的課題。這幾年,手機AI語音助手的功能也是越來越多,我們能通過語音讓它播放個歌曲、查個天氣日期、打開些APP、給好友發(fā)微信QQ消息、發(fā)個短信、打個電話、設(shè)個鬧鐘、開啟相機、下載軟件、進行搜索、播放視頻等等。但使用這些功能前我們需要先考慮,在哪些場景下適合使用這些功能。
筆者以自己為例吧,作為一個接觸手機比較多,對AI語音助手的操作也較為熟悉的人,似乎也找不到什么使用它的地方。早晨要乘坐交通工具去上班,很多人都有在地鐵或者公交車上打電話或者給發(fā)微信語音的經(jīng)歷,但有幾個人會在地鐵公交上點開自己的語音助手或者通過按鍵、語音喚醒它們,讓它給我們播報個天氣、撥打個電話或者給別人發(fā)個語音,這難免非常的尷尬。我們先不考慮環(huán)境對語音識別的影響,你真的會在公共場合對著手機,喊一聲“Hi Siri”或者“小愛同學”嗎?然后說出一大堆指令讓它們執(zhí)行,我覺得大多數(shù)人都不會。而在公司上班,大家都在忙著工作,突然想拿手機搜索個東西或者發(fā)個微信,你會喚醒語音助手讓它們進行這些操作嗎?顯然也不太可能。即便晚上回到家或者周末在家,拿起手機喚醒語音助手進行對話是不是顯得我們太過無聊了。而且這樣也不是在使用語音助手,更像是在驗證它是否真的具有這樣那樣的功能。
筆者也是體驗過多個手機上的AI語音助手,也都是在大家都很無聊時放個歌曲、查個天氣或者簡單的與它對話幾句,“調(diào)戲”一下它,這也都說不上是在使用,只能代表我用過。這仿佛就是你給了我一個籃球,告訴我各種規(guī)則,該怎么怎么玩,然后我拿著球卻發(fā)現(xiàn)附近找不到籃球場。
動動嘴真的不比手更有效率
對于語音助手發(fā)展面臨的首要問題就是語音識別率、語義理解力不足。在真實的應(yīng)用場景里,環(huán)境噪音、用戶語氣都會影響語音助手的識別率,其次系統(tǒng)對于語義的理解力也達不到要求,尤其是中文博大精深、字面語境有不同含義,有時候差一個字其意思也會天差地別,而且人與人之間的對話是結(jié)合語境的,但即便語音助手能夠識別你說了啥,但它無法針對語境進行回答或者反饋。再加上方言、口音等多種因素影響,出現(xiàn)答非所問的情況也是再正常不過了。
語音助手無法理解我們的意思或者意圖時就需要我們多次對話才能滿足我們的某項需求或者執(zhí)行操作,有的操作也是需要我們多次與之對話它才能一步步的幫我們達到最終目的,這樣繁瑣的語音操作真的比我們解鎖手機自己用手去操作方便嗎?我覺得比用手去操作效率低的多,這樣的體驗給用戶最直觀的感受就是:不好用。所謂的解放雙手真的沒有想象中的那么簡單,手機AI語音助手的最終形態(tài)是相當于我們手機端的“個人助理”,就是有需求直接對它說出,它能干凈利落的回答或者執(zhí)行,可就目前的這些語音助手是達不到這樣的需求的。有些看上去很美好的語音操作,實際體驗卻不盡如人意。
而除了一些自帶的指令外,現(xiàn)在很多手機上的AI語音助手也是支持自定義指令和學習功能,讓我們教它一些指令該如何回答或者執(zhí)行,這還是很值得鼓勵的。我也是嘗試過,一些簡單的指令確實是很容易就學會了,但有些我們雖然設(shè)置的指令很簡單,但執(zhí)行操作較為復(fù)雜的時候,即便我們一步步的教它,它往往也很難學會。即便你給我籃球了,告訴了我規(guī)則和怎么玩了,也帶我來到了籃球場,然后你突然說,用嘴說話也能操控籃球,不非得用手,我很勤奮也學著怎么嘴說話操控籃球,后來嘗試了也發(fā)現(xiàn)確實能,但明顯不如我用手打的溜,所以我決定繼續(xù)用手打球。對于很多用戶,他已經(jīng)熟悉了一種非常成熟的操作方式,為啥要再花成本去學習另一種呢?
使用場景匱乏以及操作效率偏低也就造成了即便語音助手隨處可見,但真正使用的人卻少之又少。
手機不是語音助手的好載體
對于很多廠商,順應(yīng)人工智能的大潮流,將AI語音助手放進手機是個很容易做出決定,無需開發(fā)新的硬件,基于系統(tǒng)開發(fā)軟件或者直接對現(xiàn)有產(chǎn)品進行移植便能實現(xiàn)。但從放到我們實際生活中看,它似乎很難找到使用場景,沒有場景空談功能又有什么意義?廠商想讓用戶使用語音助手,但用手指操作又更加精準和有效率。還是那句話,用戶已經(jīng)有了一套非常成熟的交互方式了,又為什么要去花成本去學習另外一個呢?
這時我們就該思考,手機到底是不是語音助手的好載體?至少從目前的體驗來看,它不是。相較于存在手機上,我覺得智能音箱是個更為出色的載體,它普遍存在于家里這種更為私密的場景中,我們與之交流也沒那么的尷尬。而且它最開始的交互方式就是語音,我們購買時也都了解到這一點,所以也更愿意去接受和學習這一種全新交互方式,雖然同樣會遇到語音識別率、語義理解不足、操作步驟繁瑣等問題,但至少沒有那么多的干擾,我們更愿意去慢慢的教它和與之對話。
而對于為啥很多手機廠商大力推動手機語音助手,是因為手機語音助手是目前凸顯其人工智能落地比較明顯的地方,簡單來說就是,很多人工智能技術(shù)都是在應(yīng)用在底層優(yōu)化,用戶根本看不到,但語音助手可以讓用戶真實的體驗到。
存在即合理發(fā)展還需要時間
從目前的使用體驗看,手機語音助手確實處在一個非常尷尬的位置,雖然功能確實越來越多,但應(yīng)用場景依舊是非常的匱乏。偶爾用到時發(fā)現(xiàn)使用語音助手進行一些操作時卻發(fā)現(xiàn)甚至比我們用手指去操作還要麻煩,這樣無法高效的融合進使用場景中的功能對于用戶來講也沒有什么意義。盡管廠商把手機上的語音助手說的怎樣高大上,應(yīng)用了人工智能技術(shù),但它無法為我們的使用體驗帶來提升那它也僅僅是個噱頭而已。當然我們也不能否認,對于那些真的不方便使用手來操作手機用戶來說,AI語音助手的存在也是為它們創(chuàng)造了一種全新而又可行的交互方式。
那么手機AI語音助手就完全沒有未來嗎?雖然目前它的表現(xiàn)確實不能讓人滿意和接受,但并不意味著它的體驗一直會如此的差。隨著技術(shù)的不斷發(fā)展,筆者覺得語音助手會讓更多的用戶接受,去使用。廠商該更多的積累用戶的數(shù)據(jù),收集更多的樣本,獲得足夠的用戶基數(shù)以及足夠的用戶使用頻率才能更有針對性的進行優(yōu)化,在發(fā)掘更多使用場景的同時也不斷地提升語音識別率、語義理解能力,優(yōu)化操作流程從而提高使用效率。同時構(gòu)建相關(guān)的生態(tài),讓更多的應(yīng)用做到不只是可以用語音控制,而是用語音控制更方便更快捷。不能一味的掛著人工智能的招牌在自嗨,將用戶的體驗做好才能得到更多人的青睞,將普及率漸漸轉(zhuǎn)化為使用率。
對于我們普通用戶來說,也該更加理性的看待手機AI語音助手,畢竟它只是一個剛剛誕生幾年的新產(chǎn)品,發(fā)展是需要時間的,直接一步登天肯定不現(xiàn)實。而當身邊的大多數(shù)人都因為其出色的功能而使用手機上的語音助手時,我們即使在公共場合也不會擔心與之對話而出現(xiàn)尷尬。相信未來有一天,我們可以和AI語音助手流暢的對話,而它也不僅僅是個人工智能而更像一個“人”,真正的提高我們的操作效率,解放我們的雙手。
評論
查看更多