小愛同學(xué)是小米公司于2017年7月26日發(fā)布的收款人工智能(AI)音箱的喚醒詞及二次元人物形象。小愛同學(xué)一經(jīng)推入市場便受萬千寵愛,網(wǎng)絡(luò)上關(guān)于小愛同學(xué)的使用體驗各式各樣,無不是在稱贊,他們對小愛同學(xué)的功能、特點(diǎn)無不熟悉,但是你知道小愛同學(xué)是怎么工作的嗎?
智能語音交互是人工智能的分支,相當(dāng)于語音助手,屬于一款智能型的手機(jī)應(yīng)用,通過智能對話與即時問答的智能交互,實(shí)現(xiàn)幫助用戶解決問題的功能。
說起智能語音助手大家首先想起的是哪些呢?
1. Siri
蘋果iOS系統(tǒng)中的人工智能助手軟件
2. Cortana
微軟開發(fā)的全球第一款人工智能助手,中文名小娜,橫跨手機(jī)與PC兩大平臺。
3. Alexa
亞馬遜推出的語音助手,主要搭載在Amazon Fcho智能音箱上。
智能語音交互是怎么實(shí)現(xiàn)交互流程中的輸入輸出呢?
智能語音交互界面事實(shí)上包含了三個技術(shù)環(huán)節(jié):
1. 語音識別(ASR)
將人類的語音中的詞匯轉(zhuǎn)換為計算機(jī)可讀的輸入,一般包括了信號處理,盡可能的降低環(huán)境噪聲、信道、說話人等因素對特征造成的影響。用戶根據(jù)系統(tǒng)設(shè)計的口令密碼與系統(tǒng)進(jìn)行溝通。
比如:小愛同學(xué)的操作執(zhí)行,每次發(fā)出指令的模式必須是“小愛同學(xué)+工作任務(wù)”,小愛同學(xué)接收后在把語音轉(zhuǎn)化成文字,再結(jié)合文字做出指令回復(fù)。
2. 語義處理(NLP)
自然語言的處理,就是把人的語言轉(zhuǎn)化成機(jī)器能夠理解的數(shù)字,分解開,并回復(fù)相應(yīng)的語言。很多在購買智能音箱之后都會有覺得是“智障音箱”的主要原因就在這里,現(xiàn)在的技術(shù)條件下,只能做到固定的回答,無法像人類一樣思考,再加上人類語言有大量的表達(dá)方式和歧義語句,理解錯誤的地方也非常多。語義處理的主要目的就是把人類語言與機(jī)器語言盡可能的相互接近,實(shí)現(xiàn)真正的用戶正常對話。
3. 語音合成(TTS)
是通過機(jī)械的、電子的方法產(chǎn)生人造語音的技術(shù),將計算機(jī)自己產(chǎn)生的、或外部輸入的文字信息轉(zhuǎn)變?yōu)闃芬饴牭枚摹⒘骼臐h語口語輸出的技術(shù),可以讓機(jī)器人像人一樣開口說話,小愛同學(xué)就是通過這項技術(shù)跟你交流的。
語音交互發(fā)展的優(yōu)勢
1. 解放雙手、雙眼、雙腿,接觸空間限制,遠(yuǎn)場可交互
2. 指向明確,語義直達(dá)目標(biāo),縮短使用路徑
3. 自然簡單人性化,學(xué)習(xí)門檻低
4. 可以一對一,也可以一對多
5. 對硬件的要求低
語音交互的劣勢
1. 不適合用戶選擇多、流程長,需要大量輔助信息決策的交互任務(wù)
2. 遠(yuǎn)場語音交互對距離、噪音、混響、聲源數(shù)量等有一定的要求
3. 不適用于公共場合,需要安靜的嘗試
4. 依賴嘴巴和耳朵,對語種、口音和發(fā)音有一定要求
5. 輸出信息單一,表達(dá)能力有限
從技術(shù)和時間上來說,現(xiàn)在的智能語音交互系統(tǒng)還是存在一定缺陷和局限的,但是我們相信任何技術(shù)都是在實(shí)踐中成長的,你們的小愛同學(xué)也會越來越惹人愛的。
-
AI
+關(guān)注
關(guān)注
87文章
30728瀏覽量
268886 -
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238253 -
智能語音
+關(guān)注
關(guān)注
10文章
782瀏覽量
48758
原文標(biāo)題:智能語音交互:你知道小愛同學(xué)是怎么工作的嗎?
文章出處:【微信號:dkiot888,微信公眾號:鼎酷IOT部落】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論