(文章來源:十輪網)
為了滿足智能助理需要執行越來越多復雜任務的需求,Google發布了最新的架構引導對話(Schema-Guided Dialogue,SGD)數據集,以擴展智能助理模型,使其有能力處理多重領域的任務。
現在的智能助理可以完成的任務越來越多,包括預定餐廳或是截取網絡消息等,Google提到,像是Google助理這類智能助理集成了眾多領域的服務,每個服務可能由不同領域的服務疊加而成。為了適應這樣的發展,讓智能助理能夠支持更多的新服務,而不需要收集額外的數據或是重新訓練模型,降低維護成本。因此Google發布SGD數據集,來填補訓練智能助理處理復雜與大規模任務所需要的數據集空缺。
SGD數據集是目前最大的任務導向對話語料庫,Google使用綠野仙蹤(Wizard of Oz)方法產生人類與助理的對話,共包含跨17個領域18,000個對話,并附加了不同的注解。這些對話涉及與服務和API的交互,包括銀行服務、事件、日歷甚至是天氣等17個領域,而在多數的領域,SGD數據集包含多個不同的API,不少API接口不同但是功能重復,以反應實際的狀況。
Google表示,SGD數據集是第一個涵蓋這么多領域,會為每個領域都提供多個API的數據集,而且為了量化模型對API接口更新或是新API的強健性,評估數據集包含了許多在訓練數據集中,所沒有的新服務。
用戶使用SGD數據集,可以訓練智能助理支持網頁的多樣服務,Google提到,要完成這個目的,通常需要一個大型的主要架構(Master Schema),羅列所有支持的功能和參數,但實際上,要開發適合所有使用案例的主架構非常困難,而且即便克服了這項障礙,主架構也可能會讓新的或是小型服務的集成變得復雜,進而增加智能助理的維護成本。
而且不少服務之間使用相似的概念,像是訂票服務,電影票、機票和演奏會門票邏輯都相似,但使用主架構的方法,就會不方便對這類概念進行連接建模,除非以手動的方式定義之間的映射。
Google提出了一個新的架構引導方法解決這些問題,這個新方法不需要為智能助理定義一個主架構,而是為每個服務或是API,提供功能與相關屬性列表的自然語言描述,這些描述可以用于學習一個架構的分布式語義表達,為對話系統提供額外的輸入,并將對話系統以單個統一的模型實例,這個統一模型為不同服務提供相似概念的表示,并通過架構的分布式表達,使得新服務可以不需要事先有訓練數據就能運行。
Google為此還以架構引導方法創建了一個智能助理,在所有服務和領域使用單一模型,沒有設置各領域的專門參數,就能處理各式任務,Google開源了用于對話狀態關注的模型,可以在新服務和API沒有訓練數據的情況下,同時保有與常規設置相同的能力。
(責任編輯:fqj)
-
谷歌
+關注
關注
27文章
6173瀏覽量
105640 -
AI
+關注
關注
87文章
31155瀏覽量
269493
發布評論請先 登錄
相關推薦
評論