2012年5月蘋果發(fā)布SIRI,帶來了一種全新的交互方式——人機自然語言交互。SIRI帶來了截然不同的用戶體驗,加上蘋果公司的夸大宣傳,很多人驚呼人工智能時代要來了。
然而很多年過去了,人機自然語言交互依然不是主流的交互方式。
2016年3月谷歌機器人阿爾法狗戰(zhàn)勝人類圍棋大師李世石,又一次讓人們對人工智能充滿了希望。2016年國內(nèi)很多人工智能和機器人企業(yè)拿到了投資。
我們看到機器學(xué)習(xí)技術(shù)的廣泛應(yīng)用確實為我們帶來了很多改變。比如語音識別和圖像識別的準(zhǔn)確率更高了。
盡管投資人、用戶以及政府都對人工智能充滿了期望,應(yīng)該看到目前的進步都還只是量變,并沒有達到質(zhì)變。
于是我們看到很多拿到投資的企業(yè)很快就變得平庸了,不再能讓我們眼前一亮。
人工智能時代,終究還沒有到來。
我以前在我的朋友圈討論過這個話題:什么是人工智能時代的正確打開方式?
我認為唯有人機交互方式的變革才能帶來行業(yè)的質(zhì)變,唯有鍵盤和觸摸屏的交互變成全自然語言的交互,人工智能時代才會到來。
最初的電腦沒有操作系統(tǒng),各家的軟硬件不兼容。有了操作系統(tǒng),才形成了軟硬件相互協(xié)作的格局,讓更多企業(yè)參與到IT行業(yè)中來了。
但最初的操作系統(tǒng)是命令化操作,只有專業(yè)人士才能記住那些復(fù)雜的命令,于是電腦成了“奢侈品”,普及困難。
后來有了視窗操作系統(tǒng),電腦成了辦公工具,很快進入了各個企業(yè)、政府、學(xué)校,成了辦公室必不可少的裝備。后來互聯(lián)網(wǎng)普及后,電腦開始進入家庭,成了游戲工具。
最初的手機是按鍵操作的。后來有廠商造出來可以替代計算機辦公和打游戲的智能手機。當(dāng)時的諾基亞和黑莓手機都非常棒,能支持移動辦公,帶來了很多便利。
但直到觸摸屏手機出現(xiàn),移動互聯(lián)網(wǎng)時代才到來了,才達到了質(zhì)變。
那么有沒有什么能替代移動互聯(lián)網(wǎng)的東西呢?我認為只有新的交互方式產(chǎn)生了,新的互聯(lián)網(wǎng)時代才會來臨。這種新的交互方式就是人機自然語言交互。
觸摸屏交互和鼠標(biāo)鍵盤交互存在的問題主要有以下幾點:
第一、菜單式操作,能容納的功能有限。大多數(shù)人在手機上安裝的APP不會多于100個,大多數(shù)人即便在電腦上安裝的軟件數(shù)量也不會多于100個。因為太多了查找起來就很困難。我們大多數(shù)人手機里的電話號碼不會多于1000個,微信里的好友很多人連5000個都沒有加滿。這都是受限于操作系統(tǒng)需要通過菜單展示信息。
第二、需要人理解機器。過去計算機要輸入漢字是件很困難的事情。我們上學(xué)時最流行的是五筆字型輸入。需要參加培訓(xùn)才能學(xué)會這種輸入法。現(xiàn)在也需要通過各種輸入法去解決漢字輸入的問題。這就需要我們理解輸入法的規(guī)則。過去很多軟件操作都很復(fù)雜,需要經(jīng)過培訓(xùn)成為專業(yè)人士用戶才能使用。現(xiàn)在盡管軟件都智能了很多,但一些軟件還是需要人們?nèi)W(xué)習(xí)才能掌握它的使用方法。
第三、需要近距離操作,占用手和眼。無論鍵盤鼠標(biāo)還是觸摸屏,都需要近距離操作,需要手眼配合。因此在用計算機和電腦的時候,我們就不能干別的事情。另外,也因為近距離操作,限制了人們的使用場景。例如,必須有電源,有辦工桌安放電腦等等。
SIRI讓我們看到了一個新的機會,就是人機交互方式變革的機會。如果可以語音和機器交互,那鍵盤鼠標(biāo)觸摸屏就都不需要了。我們可以通過語音交互讓機器為我們服務(wù)。手和眼被解放了出來,而且我們不再需要理解機器的規(guī)則。機器有成千上萬的功能,它根據(jù)我們說的話去理解我門的意圖,提供令我們滿意的服務(wù)。我們可以語音告訴機器人我們要買的東西,它幫我們完成購買和支付。我們可以語音告訴機器人出差的時間和目的地,機器人幫我們訂票和訂酒店,然后反饋結(jié)果給我們。我們可以告訴機器人我們要吃什么東西,機器人自動幫忙叫外賣并完成付款。我們可以語音駕駛汽車,只要告訴汽車我要去哪里就可以了。我們不需要知道機器有哪些功能,我們只需要按自己的習(xí)慣表達,機器人會自動去匹配它的功能。這樣,即便機器有千千萬萬的功能,也不會讓我們使用上感到困難。
為什么SIRI不能實現(xiàn)以上功能呢?很多時候,那些SIRI一類機器人更像個智障。
其實人機自然語言交互需要的不僅僅是自然語言處理,而是一個系統(tǒng),一個大腦。語言處理的過程就是思辨的過程。我說“吃”,你不知道我說的啥意思,但我說話的對象就能聽得懂。因為他從我這里獲得的信息比你多,他能綜合各個信息通過思辨來理解我的意圖。語言本身是模糊的,甚至矛盾的。說“是”也許表達的是否定,說“快樂”也許表達的是傷心。只有通過思辨才能理解一句話。機器要理解人就需要機器具備思辨能力,思辨能力就是智慧。如果像寫普通程序那樣寫人工智能程序,不會讓機器擁有思辨能力。
其次,只有機器擁有了相應(yīng)的知識才能解決相應(yīng)問題。但人類的知識是個無限集,是非常非常龐大的。只有通過UGC的模式,讓每個參與者都為機器人提供知識,才能保證機器人擁有無限多的知識。如果需要通過訓(xùn)練來讓機器人擁有知識,那普通用戶是無法參與的。
另外,語言是流動的是模糊的。一個詞在現(xiàn)代包含的意思和在古代不一定完全相同。一句話在不同的場合含義都不一樣。要理解語言,不是理解字面,而應(yīng)當(dāng)去理解文字背后的語義。如果把語言當(dāng)成處理對象,那就錯了。
最后,很多人用菜單式的系統(tǒng)結(jié)構(gòu)做人機自然語言交互的系統(tǒng),這就錯了。人機自然語言交互的系統(tǒng)是平行結(jié)構(gòu)的。如果有菜單,用戶就要去理解菜單,那就不是智能了。應(yīng)該是機器人理解人,根據(jù)人的意圖去平行調(diào)用各種功能模塊。對于平行結(jié)構(gòu),我們的定義是所有功能都在第一級別。想進入一個功能就進入,不想進入不能進入,想退出就退出,不想退出就不能退出。
我們氖星智能經(jīng)過很多年的研究,我們的DSA-nlp算法已經(jīng)相對成熟了,我們能讓機器在最大程度上理解用戶意圖,能理解上下文,能讓對話變得自然流暢。
我們的目標(biāo)是成為新的流量入口,人機自然語言交互時代的流量入口。各家大廠都在推智能音箱,都是在爭這個入口。但能取勝的,一定是交互最流暢的。我們擁護先進的人機自然語言交互技術(shù),一定能在這個市場擁有自己的地位。
因為我們研究了十多年的NLP技術(shù),我們能處理上下文,我們的系統(tǒng)結(jié)構(gòu)是平行結(jié)構(gòu),我們提出了人機自然語言交互的四個標(biāo)準(zhǔn):差異性、同一性、模糊性、一致性。差異性就是機器人能理解語言之間的細微差異,比如“你干嘛”和“你干嘛的”。同一性就是能理解兩句話語義是相同的,比如“你公司在哪里”和“貴司地址是什么地方”。模糊性是指當(dāng)語音識別把“甲硝唑是什么”識別成了“早上做是什么”的時候也能正確處理。一致性是指機器真正理解了語義,前后說的話不矛盾。我們嚴格按照這四個標(biāo)準(zhǔn)在建設(shè)我們的系統(tǒng)。我們可以保證我們的機器人對用戶輸入理解的準(zhǔn)確率可以很高,保證人機對話可以自然流暢。
我們推出了氖星智能平臺www.neonstar.cn,能讓每個用戶建立自己的機器人。比如,你是個醫(yī)院,你建個機器人回答健康問題。你是個律師事務(wù)所,你建個機器人回答用戶法律問題。你是個駕校,你建個機器人回答關(guān)于汽車駕駛問題。我們平臺已經(jīng)有不少機器人了。他們一起為用戶解答各種各樣的問題。我們開發(fā)了氖星知道APP(以下是氖星知道下載地址:http://www.naistar.com/download/zhidao-release-signed.apk),用戶提問,機器人搶答。未來幾年我們氖星知道的用戶數(shù)會突破1億。
快來我們平臺建立自己的機器人,在人工智能時代提前布局吧!這里才是通往人工智能時代的真正入口。
-
機器人
+關(guān)注
關(guān)注
211文章
28388瀏覽量
206922 -
觸摸屏
+關(guān)注
關(guān)注
42文章
2301瀏覽量
116126 -
人工智能
+關(guān)注
關(guān)注
1791文章
47205瀏覽量
238272
原文標(biāo)題:快來看!這里才是通往人工智能時代的真正入口!
文章出處:【微信號:robot-1hjqr,微信公眾號:1號機器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論