從藍海殺成紅海的語音科技,如何才能轉(zhuǎn)化成智能家庭的入口
各種調(diào)查數(shù)據(jù)顯示,智能家居市場規(guī)模在未來幾年,將會突破萬億,巨大蛋糕吸引了眾多玩家參與,也涌現(xiàn)出眾多創(chuàng)新企業(yè),然而,要實現(xiàn)智慧的生活,這其中涉及到跨平臺、跨品牌等互聯(lián)互通是基礎(chǔ),處在產(chǎn)業(yè)鏈核心斷的公司積極搭建生態(tài)建設(shè),在這個智能家居市場整頓中,誰能聚攏更多第三方資源,誰就占住主導(dǎo)權(quán),一個簡單的語音人機交互對話場景中,機器穩(wěn)中帶皮的表現(xiàn)算是我們對于智能音箱最基本層面、最直觀的認識了。而事實上,這并非智能音箱的最終形態(tài)。
智能音箱大混戰(zhàn)從前年開始,已經(jīng)在作為中國硅谷科技的前沿的巨頭間打得焦頭爛額。然而一直被全球認為是消費潛力巨大的中國市場,卻在智能音箱領(lǐng)域陷入尷尬的境地。目前為止,國內(nèi)還未出現(xiàn)單品銷量突破1000萬臺的智能音箱產(chǎn)品。
互聯(lián)網(wǎng)巨頭眼中,智能音箱被定義為是繼PC電腦圖形化系統(tǒng)+鍵鼠外設(shè)交互方式、智能手機+觸屏操作交互方式之后的新形態(tài)交互方式,是后互聯(lián)網(wǎng)時代的下一個超級入口。看整個互聯(lián)網(wǎng)技術(shù),就是數(shù)字技術(shù)顛覆性的變革和機會。我們最近在大力的推語音(智能音箱),其實都是一樣的,智能音箱的工作原理:人發(fā)出指令——音箱對聲音處理識別——傳輸服務(wù)器作出回應(yīng)——傳回智能音箱或者其他服務(wù)器——得出結(jié)果(其他設(shè)備開始運行)。
毫無疑問語音是未來一個互聯(lián)網(wǎng)入口。有效的搶占了下一個互聯(lián)網(wǎng)的超級入口就意味著在互聯(lián)網(wǎng)的下一個時代里會擁有更多的主動權(quán)和話語權(quán),因此被譽為下一個互聯(lián)網(wǎng)超級入口的智能音箱產(chǎn)業(yè)早已形成巨頭環(huán)伺的競爭形態(tài)。
目前,各品牌的智能音箱除了充當(dāng)語音交互方式的鬧鐘設(shè)定、天氣提醒查詢、翻譯、算數(shù)等基本生活小助手之外,同時還兼顧路況、百科查詢,點外賣、叫專車等貼身小管家一職。技能的拓展性、應(yīng)用場景的適應(yīng)性在不斷增強。
僅僅在深圳南山區(qū)一公里以內(nèi),就有112家公司做語音智能?!庇腥绱酥嗟墓驹谧鲋悄芤粝?,但真正成為了產(chǎn)品用戶的公司卻少之又少,對于智能硬件來說,沒有銷量,都是空談。有人曾用這么一句話形容目前國內(nèi)的智能音箱市場:行業(yè)爆款轉(zhuǎn)身變成了雞肋。
在智能音箱領(lǐng)域,用戶體驗是經(jīng)常被強調(diào)的點,語音交互與服務(wù)內(nèi)容則是競爭核心。而智能音箱行業(yè)發(fā)展的最大瓶頸則是AI技術(shù)的不成熟。目前AI技術(shù)雖愈加火爆,但仍處于弱人工智能階段,其語音識別、語音合成、自然降噪等技術(shù)僅僅處于“可用”階段,遠未能滿足人類的深度體驗。
在智能音箱使用之前,需要加入局域網(wǎng),而這一步需要在相應(yīng)的手機app中操作才能實現(xiàn)。雖然這只是初始的一步,卻反映出手機在智能家居體系中的重要地位。與小巧便攜的手機相比,智能音箱顯得臃腫了很多,尤其是對于許多經(jīng)常出差的商務(wù)人士而言,智能音箱的使用率更是大打折扣。
在智能音箱背后,真正起作用的是語音助手,語音助手的背后則是基于大數(shù)據(jù)的人工智能。而人類是情感動物,智能音箱發(fā)展到今天之所以還沒有成為人們生活中的常態(tài),是由于AI技術(shù)還停留在機械化階段,無法消解人類的孤獨感。
盡管現(xiàn)在的AI音箱能夠完成人類的一些指令,但想要進一步發(fā)展,需要完成從機械式執(zhí)行到情感式對話的轉(zhuǎn)變。要實現(xiàn)這一點,就需要AI技術(shù)更加成熟,需要AI朝著人性化的方向發(fā)展。
術(shù)硬傷難以突破:語義識別以及中文語言識別
智能音箱相關(guān)分析表示:在對話方式上,一些中國制造商生產(chǎn)的設(shè)備語音識別準(zhǔn)確率低,中文自然語言的整體理解和反應(yīng)依舊不夠成熟,這是阻礙普及的一個關(guān)鍵原因。
語義識別是目前智能音箱的一個痛點,但也是AI技術(shù)的一大問題。AI可以下圍棋戰(zhàn)勝李世石,但它現(xiàn)在不一定能聽明白每個人在講什么。"
因為智能音箱的語音技術(shù)可以分為三個階段:噪聲抵消、語音識別,和語義識別。相對于國外,我國在于AI智能語音助理上的發(fā)展水平暫處于相對落后的狀態(tài)。而對于智能家居這種產(chǎn)品來說,其技術(shù)核心是依賴語音聲控,背后是人工智能的智能識別能力與深度學(xué)習(xí)能力。
雖然現(xiàn)在國內(nèi)在相關(guān)技術(shù)上已經(jīng)有一定的突破,比如科大訊飛,思必馳等公司都是具備語音識別能力的廠商。但當(dāng)前,國內(nèi)的智能音箱廠商還沒有人工智能方面的平臺優(yōu)勢,可以像亞馬遜、谷歌那樣跨越多個垂直領(lǐng)域進行資源整合的能力。
另外,除了在技術(shù)實力的原因以外,其語義識別的主要問題在于中國復(fù)雜的語言環(huán)境。
目前市面上的AI音箱只支持中文普通話交互,與中國的人文環(huán)境有所差異,實際情況卻不如想象中那般簡單:中國地域廣袤,方言語系多樣,據(jù)不完全統(tǒng)計,僅彼此不能相互溝通的方言就有80多種。
雖然普通話已經(jīng)普及了幾十年,但截至今日,仍有不少人不會說普通話;而夾雜方言的“偽普通話”更是多如牛毛。在語境方面,也不利于機器的語音學(xué)習(xí)和大數(shù)據(jù)手機。相比國外的智能產(chǎn)品,我國在本土智能音箱的發(fā)展過程中,僅在語言關(guān)方面,就需要多耗費數(shù)倍的研發(fā)精力。
因此,由于智能音箱在漢語的語音識別和語義交互等對話式交互技術(shù)還尚未成熟,都嚴重影響著用戶體驗。在目前的過渡階段,提高音箱耳機產(chǎn)品本身的性能才是企業(yè)的重中之重。而只有當(dāng)語言交互界面技術(shù)成型,并發(fā)展為標(biāo)準(zhǔn)服務(wù)時,智能音箱在有可能在中國市場真正普及起來實際上,國內(nèi)對于人工智能的技術(shù)還沒有使用習(xí)慣,智能音箱算是整個AI領(lǐng)域發(fā)展較為快速的。其實,我們也能從中看出一大問題,就是智能音箱的核心價值沒有標(biāo)準(zhǔn)化,沒有抓取到用戶的核心需求,很多人都是在為智能而不是音質(zhì)等需求買單,總的來說,不論關(guān)鍵在不在于技術(shù),而是如何讓技術(shù)符合你的生活需求,AI需要實實在在的應(yīng)用。
盡管今年互聯(lián)網(wǎng)巨頭在智能音箱上價格戰(zhàn)劇烈,但智能音箱發(fā)展仍呈現(xiàn)差異化的幾個方向,這主要源于智能音箱品牌全品類布局與差異化布局。在十幾家智能音箱品牌的二三十款音箱中呈現(xiàn)出4個特點:入門mini產(chǎn)品、大眾產(chǎn)品、高端產(chǎn)品、兒童產(chǎn)品。
-
人機交互
+關(guān)注
關(guān)注
12文章
1210瀏覽量
55441 -
智能語音
+關(guān)注
關(guān)注
10文章
787瀏覽量
48814
原文標(biāo)題:從藍海創(chuàng)新到紅海突圍:智能語音核實能飛入尋常百姓家
文章出處:【微信號:mojay_semi,微信公眾號:茂捷半導(dǎo)體】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論