近年來隨著深度學習和神經網絡技術的發展,機器翻譯也取得了長足的進步。神經網絡結構越來越復雜,但我們始終無法解釋內部發生了什么,“黑箱問題”一直困擾著我們。我們不清楚程序在翻譯過程中如何進行決策,所以當翻譯出錯時也很難改正。隨著深度學習在各行各業中的廣泛應用,深度學習的不可解釋性已經成為其面臨的嚴峻挑戰之一。
今年,在德國柏林舉辦的 IEEE VAST 可視化分析大會上,來自 IBM 和哈佛大學的研究人員展示了為解決翻譯中的 AI 黑盒問題所開發的調試工具。這款名為 Seq2Seq-Vis 的工具能將人工智能的翻譯過程進行可視化,方便開發人員對模型進行調試。
Seq2Seq-Vis 主要針對機器翻譯中最常用的 Seq2Seq模型。這一模型能夠將任意長度的序列,也就是原文的句子,映射到目標語言。除了機器翻譯任務,在自動問答、文本摘要等任務中也都主要應用 Seq2Seq模型。
簡單來說,Seq2Seq模型在機器翻譯中的工作原理就是把源語言映射到目標語言,得到了目標語言的序列(也就是初步翻譯完的句子)后再進行優化,保證語法和語義上的正確。雖然使用神經網路模型后,機器翻譯的結果得到了很大的提升,但同時也非常復雜。
可視化機器翻譯的過程
研究人員稱研發 Seq2Seq-Vis 的初衷是想有一個類似于基于規則的傳統翻譯軟件中的規則表,這樣開發人員可以通過在規則表中對照得到錯誤信息就可以很簡單地修改模型。
Seq2Seq-Vis.io 網站上給出了一個從德語到英語的演示程序。德語的“die l?ngsten reisen fangen an , wenn es auf den stra?en dunkel wird.”翻譯成英語應該是“The longest journeys begin when it gets dark in the streets.”,但被機器翻譯成了“the longest travel begins when it gets to the streets.”Seq2Seq-Vis 以可視化的方式呈現出了序列到序列模型翻譯的每一步,這樣用戶就能像查找規則表一樣來找出機器翻譯翻譯錯誤的原因。
Seq2Seq-Vis 另一個很有用的功能是它能找出與某個字詞相關的訓練集,這也是解決 AI 黑盒問題的一大難點。其實一個機器學習模型除了訓練集一無所知,所以要解決機器翻譯中的錯誤最終都要回到訓練集中去。
將機器翻譯過程可視化,用戶就能確定翻譯出錯到底是編碼器解碼器使用的訓練樣本出了錯還是注意力模型的設置或者其他環節出錯了。
更正序列到序列模型
Seq2Seq-Vis 并不是第一個試圖解決 AI 黑盒問題的工具,之前有很多大公司和研究機構都有進行嘗試,甚至 IBM 自己也在這上面下過功夫。事實上,很多類似的工具需要的信息比 Seq2Seq-Vis 更少,比如有的工具只需要神經網絡的輸出就可以,而 Seq2Seq-Vis 還需要訓練集,整個模型的架構和設置。但 Seq2Seq-Vis 卻是第一個既能可視化模型的決策過程也能讓開發人員直接修改模型的工具。開發人員可以通過可視化的方式對模型的決策過程進行修改并觀察反饋來實現探索式的調試,比如修改輸出序列的單詞或者對注意力模型的配置進行修改。
聽起來是不是很酷,不過Seq2Seq-Vis 的目標群體是模型架構師或工程師而非機器翻譯的終端用戶。因為要讓這一工具真正發揮作用需要用戶對“序列到序列”模型有較為深入的了解。雖然目標這一工具還只是應用在IBM的內部項目中,但它是開源的,所以大家都可以來試試。
-
人工智能
+關注
關注
1791文章
47183瀏覽量
238258 -
機器學習
+關注
關注
66文章
8406瀏覽量
132565 -
機器翻譯
+關注
關注
0文章
139瀏覽量
14880
原文標題:開源 | IBM、哈佛共同研發:Seq2Seq模型可視化工具
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論