臨近歲末年初,各大科技廠商都卯著勁兒相繼發布新技術、新產品,其中,一場關于“新圖靈測試”的探討,及其所打開的廣袤空間,就成為業內熱議的對象。
年中的2020 智源大會上,京東集團技術委員會主席、京東智聯云總裁、京東人工智能研究院院長、IEEE Fellow 周伯文,在與斯坦福大學教授、人工智能實驗室負責人克里斯托弗·曼寧(Christopher Manning)的對話中,提出了圖靈測試的“替代方案”。
而前不久的CIIS2020上,京東將多模態內容生成、多輪對話等AI技術,與智能交互機器人流程自動化(RPA)相結合,打造出能夠適配千變萬化的消費者需求和服務產業復雜業態的智能交互技術體系。
不僅讓“新圖靈測試”成為可能,也讓我們看到了AI與RPA結合的“京東思路”,正在從決策到管理、執行的聯動,給產業數字化帶來的全新發展機遇,正逐步清晰地浮現在我們眼前。
一種悖論:為什么說圖靈測試不適合做產業數智化基準
圖靈測試(The Turing test),是人工智能領域的基礎名詞,艾倫·麥席森·圖靈在1950年預測,到2000年人工智能可以在5分鐘的問答中騙過30%成年人。
那么,發展了數十年的AI到底有沒有達到圖靈的預測標準呢?
伴隨著GPT3、BERT等大規模、高性能的算法出現,AI不僅能寫詩繪畫講故事,甚至還能模仿客服給消費者打營銷電話,騙取人類信任……看起來似乎已經達到了預測中的水平。
但究其本質,圖靈的預言其實指向一種具有真正智能的機器的可能性,意味著人類能夠打造出具備思考能力的機器。2014年人工智能軟件尤金·古斯特曼(Eugene Goostman)通過了圖靈測試,被認為具有人類智能,但實際上,這位“尤金”還遠遠不能思考。
這種表與里的悖論,讓圖靈測試作為智能的評測基準(Benchmark),在落地產業AI化過程中存在兩個待解的問題:
一是無法量化。盡管目前許多算法可以通過圖靈測試,但這一評測基準對AI應用落地產業沒有直接幫助和參考。因為圖靈測試沒有規定問題的范圍和提問的標準,跟人類進行隨機的、無特定內容對話的交流。要評價一個AI系統的智能程度,就如克里斯托弗·曼寧教授在會議中所提到的那樣,“需要找一個另外的方法,標量真正的理解、真正的持續對話”。
圖靈測試的第二個問題,則是無法檢驗AI系統在產業應用的效率。在產業智能化進程中,AI往往需要被用來解決具象的問題,比如幫助零售商與消費者流暢地溝通,這就要求其具備一種“寬泛的心理能力”,需要調動意圖感知、語音識別、語義分析、內容生成等等具體能力,而這都是圖靈測試無法具體評測到的。
從這個角度看,尋找新的評測標準,是AI走進社會化大生產之后水到渠成的產業需求。
一個可能:AI+RPA如何打開新圖靈測試的天地
既然圖靈測試并不能滿足產業應用AI時的評測需求,所以周伯文才會提出一個很新穎的概念,直接讓兩個對話型 AI 做直播帶貨,通過統計以每小時能賣出多少商品的可量化指標,來對比哪個 AI 的對話更吸引人,從而評估對話型 AI 的智能化水平。
這個創意,在CIIS 2020上就變成了現實。周伯文在現場分享了這個進階版的“帶貨測試”:
京東對數以億計SKU進行賣點挖掘,自動生成文案、背景音樂、虛擬形象,再配上咨詢導購客服,整套服務可以自動化地生成每件物品的專屬主播介紹,與觀眾用彈幕和語音實時交流,答疑解惑,把直播產業以規模化、自動化的方式推廣到億級的播放和商品銷售上去。
要完成這一實時、可量化的智能交互,需要的技術是非常多面的。首先需要利用深度學習神經網絡和知識圖譜對物品資料進行識別和理解,然后系統根據多模態數字內容生成技術,可以自動生成一個精彩的解說詞,自動挖掘賣點、自動生成銷售文案、生成語音背景和音樂,還會為每個消費者生成獨特的虛擬形象,再利用京東TTS語音驅動虛擬主播進行講解。
舉個例子,當消費者跟智能客服或智能主播對話時,用文字表達自己的困惑“我想找一件黃色的、有波浪邊的輕薄連衣裙”,多模態智能對話可以快速將這些文字以圖像化的形式表達出來,將符合要求的圖片呈現出來,同時,主播還會活靈活現地向消費者介紹“裙擺可以像風一樣擺動哦~”
解說過程中,根據消費者的實時彈幕,系統需要快速根據上下文多輪對話策略進行內容識別、意圖感知,來實時調整自己的講解節奏、內容、情緒。
令消費者縮短無效觀看時間,與主播一對一交流;同時也可以讓眾多商家低門檻、自動化地用直播方式帶貨。AI主播還可以進一步收集消費者的問題與困惑,及時地反饋給商家進行迭代和優化,等于擁有了一個零售顧問。
京東平臺的實踐數據顯示,目前該技術已經在好貨頻道、社交電商、售前導購機器人京小智、搭配購、什么值得買APP等生成了5000萬個素材,其中AI素材曝光點擊率是人工素材的1.4倍。讓機器更懂人心、更會說話,這正是京東將AI+RPA融合之后的智能服務所帶來的魅力。
順著“帶貨主播”模式開始延伸,我們可以看到作為“新圖靈測試”背后的技術組合——AI+RPA到底與傳統的智能體有哪些不同?
首先,同樣是人與機器的交互,AI+RPA的效果可以量化,支撐產業端的運營、管理、決策。比如對話型 AI 做直播帶貨,可以在與消費者的對話中不斷自我學習進化,在垂直領域變得更具智能感,輸出更吸引人的內容。
其次,AI+RPA的協同賦予了自動化服務以自主判斷、決策、推理能力,設計了具體而清晰的協作任務,如同一個智慧的大腦突然具備了四肢和行動能力,其中AI作為大腦可以提升系統的服務效率,獨立承擔起一些簡單、重復的工作。
最后也是最重要的,AI+RPA背后的核心邏輯與技術體系有著很強的泛化能力,在服務業數智化轉型中的許多流程中都有著清晰的價值體現。
執行層將服務員、客服等一線員工從重復中解放出來,幫助他們提升工作效率;管理層,抽離出有用的信息,利用邏輯推倒實時分析業務變化;最后形成直觀的可視化報告或數據圖,幫助決策層提升決策效率。
比如基于京東在智能交互RPA和數據智能領域的積累,京東智聯云所打造的“咨詢大腦”,就被用來構建城市咨詢智力中心,可以提供涵蓋民生、政務服務、精細化管理、公共安全等多個領域的服務。
從智能交互出發,可以清晰地看到服務業的迭代路徑與可行性。這也是為什么,周伯文會說,這種任務導向型對話智能(Task-oriented Conversational Intelligence)將帶來人機交互技術驅動的萬億級市場。
三方突圍:京東如何破解服務業數智化的三重困境
在CIIS2020上,周伯文表示,產業數字化是傳統行業利用AI等新一代信息技術提升效率,而服務業涉及非常多的行業,如金融、教育、電商、物流,數字化和智能化水平并不一致。接下來應該是人和AI協作的深化,進一步提升服務的效能。
這是智能時代科技企業的增長密碼,也是京東努力的核心方向。
目前來看,服務領域的數智化存在三重難題:
一是服務業的重塑之難:很多現有的標準化服務流程完全可以被重塑、重造,進而提升服務效能,但傳統服務業在智能技術認知和基礎設施方面相對較弱,加上需求、規模、痛點的千差萬別,需要一個全場景的體系來實現適配。
二是基礎設施的運維之難:許多服務業對于智能技術都存在認知不足、人才短缺等問題,而AI項目落地的成功率直接取決于其批量復制、高效運維的能力,如何把工程化的數據運維、模型運維、開發運維三大核心支柱,通過工具化的生命周期管理整合并提供給產業,是科技企業必須努力解決的。
三是多模態的交互之難:在復雜的現實環境中,用戶的意圖往往會以多模態方式來展現,語言、文字、圖像、視頻等等都可以作為媒介來傳遞信息,傳統AI一旦需要處理邊界和規則不清晰的問題,效率就迅速下降。只有在解決深度語義理解、多模態交互技術、對話內容生成、復雜場景下的多輪對話與決策技術等等之后,智能交互才能真正釋放行業創新價值。
也正是如此,京東發布的多模態交互與內容生成等一系列解決方案,讓千人千面的智能交互應用開始真實地走入產業端,服務業數智化轉型的浪潮快速到來。
舉個例子,傳統的客服機器人只能將市民抱怨的問題記下來,然后提交給后臺工作人員去安排和處理。而伴隨著智能交互系統的落地,山西大同的12345近來就出現了一些顯而易見的改變,可以通過智能動態交互的方式準確地理解是哪里、是什么情況、什么路燈,通過數字化的私有云管理體系調動相關區的衛生局,通過和相關人員進行AI外呼聯系解決這個問題,并創建這個工單和狀態。
在確認修好之后,市長熱線再外呼電話,告訴市民修好了這種接訴即辦的智能服務,會不會讓每一個打開電話的市民感受到一種城市管理的速度與文明呢?在疫情防控嚴格的當下,智能交互基礎上的智能疫情外呼系統,也可以自動化完成外呼疫情排查、通知、信息采集、病例回訪等工作,是不是可以有效減輕醫護和基層人員的負擔?
我想上述答案都會是肯定的。
智能交互還可以應用到客服領域。如果你也曾厭倦過撥打客服電話時冗長的等待、牛頭不對馬嘴的溝通,那么智能交互可能會在未來拯救你和客服雙方。
傳統客服模式下,人工客服需要將三分之二時間用在理解客戶的需求上,剩下是用在后臺查詢、業務辦理,以及創建摘要,為客戶完成后續服務的跟蹤和閉環上。而京東智能交互可以在分配電話坐席前,就進行機器探索,把合乎的畫像和需求匹配到最適合的人工智客服那里;比如手機的特殊功能,會找到手機專家回答問題。
在實時對話中,系統會自動識別高濃度負面情緒。在疫情期間,智能客服就曾在與一位年輕客戶的交談中,感知到對方在購藥之后出現了情緒低沉的情況,在安撫的同時,及時聯系了心理咨詢專家。618期間,智能人機交互系統就為京東平臺服務了7800萬人次,使得原來的人海戰略客服變成智能接待的方式,使得客服中心效率提升90%。
從識別到理解,再到生成千人千面的個性化服務,是AI能力的迭代進化,也展現出京東對連接技術與產業的獨特思考。在技術創新的同時,賦予其廣袤的產業價值機會點,在產業AI化、AI產業化的當下,進一步點燃了AI改造世界的可能性。
周伯文在發言的結尾說道:下一個10年,以技術為本、基于智能交互的服務業數智化將是我們下一個產業巨大的浪潮。
這是未來的起點,也是等待你我一起去挖掘和感受的特殊時刻。
審核編輯:符乾江
-
人工智能
+關注
關注
1791文章
47183瀏覽量
238246 -
交互技術
+關注
關注
0文章
33瀏覽量
12719
發布評論請先 登錄
相關推薦
評論