一組微軟研究團(tuán)隊于本周三宣布,他們已經(jīng)創(chuàng)造了第一個能夠?qū)⒅形男侣劮g成英文的機(jī)器翻譯系統(tǒng),精確度與人類譯者一致。該公司表示,它通過來自各種在線報紙的約2000條語句樣本對這一系統(tǒng)進(jìn)行了反復(fù)測試,并將測試結(jié)果與人類譯者的翻譯進(jìn)行了比較,它還甚至聘請了外部的雙語顧問來進(jìn)一步驗證機(jī)器的精確度。
這一被稱為newstest2017的樣本集已于去年秋天在研究會議WMT17上發(fā)布。
令人感到驚訝的是研究人員能夠如此快速的達(dá)到這一里程碑,尤其是機(jī)器翻譯是人們幾十年來一直在試圖解決的問題。“機(jī)器翻譯要比單純的模式識別任務(wù)復(fù)雜得多,”微軟亞洲研究院助理總監(jiān)兼自然語言處理小組負(fù)責(zé)人周明說道?!叭藗兛梢允褂貌煌膯卧~來表達(dá)相同的意思,但你無法判斷哪一種更好?!?/span>
微軟還指出,最近在AI方面取得的進(jìn)展,為研究人員實現(xiàn)這一里程碑作出了貢獻(xiàn)。
深度神經(jīng)網(wǎng)絡(luò)——一種訓(xùn)練AI系統(tǒng)的方法,允許研究人員創(chuàng)造更加流利自然的翻譯,并考慮到更廣泛的內(nèi)容背景,這一超前的方法被稱之為統(tǒng)計機(jī)器翻譯。
微軟的研究人員還在系統(tǒng)中增加了他們自己的訓(xùn)練方法,以提高其精確度。這些方法類似于人們?nèi)绾沃貜?fù)自己的工作時間,并再次確認(rèn)是否正確的過程。研究人員表示,他們使用的方法包括雙重學(xué)習(xí)的事實檢查翻譯;審議網(wǎng)絡(luò),進(jìn)行重復(fù)翻譯和改進(jìn);聯(lián)合訓(xùn)練等新技術(shù),以迭代促進(jìn)英到中和中到英翻譯系統(tǒng);以及協(xié)議正規(guī)化,即通過左到右和右到左閱讀語句來生成翻譯。
周明表示,用于實現(xiàn)這一里程碑的技術(shù)不會局限于機(jī)器翻譯?!斑@是機(jī)器翻譯研究可以應(yīng)用于人工智能研究全部領(lǐng)域的領(lǐng)域,”周明表示。
此外,它可以在未來讓其他語言的翻譯更加準(zhǔn)確和自然。研究人員表示,這一系統(tǒng)尚未在實時新聞報道中測試過,在該技術(shù)被商業(yè)化到微軟產(chǎn)品前還有其他的挑戰(zhàn)需要解決。
但是你可以在微軟的網(wǎng)站上使用這一新的翻譯系統(tǒng)。
系統(tǒng)將顯示一個中文(簡體)句子,然后以兩種方式進(jìn)行翻譯,右邊的翻譯會更加完善以表明這一技術(shù)的先進(jìn)性。機(jī)器翻譯是谷歌的研究人員一直致力于研究的內(nèi)容,包括使用谷歌的機(jī)器學(xué)習(xí)技術(shù)進(jìn)行中英文查詢。這些進(jìn)展已經(jīng)付諸實施,以改進(jìn)谷歌面向消費者的產(chǎn)品,比如谷歌翻譯應(yīng)用,以及谷歌搜索的整合。
-
微軟
+關(guān)注
關(guān)注
4文章
6590瀏覽量
104026 -
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238265
原文標(biāo)題:微軟宣布在機(jī)器翻譯方面取得突破,中翻英可達(dá)人類水平
文章出處:【微信號:gh_211d74f707ff,微信公眾號:重慶人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論