色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么AI的翻譯水平還遠不能和人類相比?

電子工程師 ? 來源:未知 ? 作者:工程師李察 ? 2018-08-18 08:49 ? 次閱讀

前一段時間,大家都在熱議 Google 的翻譯系統出現了一些相當奇怪的結果,例如下圖呈現的是最被大家談及的一個翻譯結果。

后來 Google 發言人也對包括數據在內等因素做出了解釋(“這只是一個將無意義的話語輸入系統然后產生無意義輸出的功能”),隨后界內一些技術人員也發表了分析與評論,表示這可能與 Google 采用的 NMT(神經機器翻譯) 技術有關。

然而經過這一系列事件過后,大家又重新開始思考一個問題:AI 的翻譯水平真的已經可以和人類媲美了嗎?而本文的作者從 NMT 技術出發,分析了這項技術仍存在的問題,給出了自己明確的態度及答案:AI的翻譯水平還遠不能和人類相比。

最近,諸多媒體都報道了有關人工智能的翻譯已經可以達到人類譯者水平的新聞,如:

The Verge – Google's AI translation system is approaching human-level accuracy

The Verge – 谷歌 AI 翻譯系統的準確度趨近于人類

Quartz – AI-based translation to soon reach human levels

Quartz – 基于人工智能的翻譯即將達到人類水平

ZDNet - Microsoft researchers match human levels in translation news from Chinese to English

ZDNet - 微軟研究員表示,機器翻譯中文新聞的水平可與人類匹敵

這一顯著突破源于神經機器翻譯(Neural Machine Translation, NMT)的出現,該方法使用神經網絡來進行機器翻譯。這項技術應用起來非常出色,是因為它有處理大規模翻譯數據的能力。谷歌、Facebook 等大型科技公司在過去幾年都引入了 NMT,并開發出了較高水平的翻譯功能。

一個例子:引入 NMT 后,谷歌翻譯的水平有明顯提升

但 NMT 系統真的可以像上述題目說的那樣,已經可以和人類譯者相比了嗎?還差得遠呢。我們發現,目前的 NMT 系統并沒有他們所說的那么好用,他們忽視了翻譯中的許多關鍵問題。

什么是 NMT?

NMT 在整個 AI 領域中的位置

機器翻譯(MT)是 AI 的一個分支,它致力于通過軟件來進行不同語言之間的翻譯。神經機器翻譯(NMT)是一種較新穎的方法,它利用神經網絡實現機器翻譯。神經網絡可以被訓練,對數據進行模式識別,從而將輸入數據轉換為我們所需要的形式。接下來,我們看一個有關 NMT 系統的例子:

一個例子:將法語翻譯成英語,引入 NMT 后質量有所提高

如果要將一句法語翻譯成英語,NMT 的執行過程如下:先把需要翻譯的法語句子輸入網絡,其中每個單詞都會被編碼成由數字組成的向量,這樣網絡才能對其進行處理。接下來,這些數字經過一系列數學公式的計算,最終生成一個新的數字序列,這個序列就代表了要輸出的英文句子。

除了上述過程,在實際情況中,還有幾個重要步驟:

在進行翻譯前,人類工程師需要決定網絡的具體結構;

工程師若要運行這樣的網絡,需要使用具備強大處理能力的計算機;

網絡需要基于大量的語料數據,進行反復訓練,才能具備合格的翻譯水平;

最后,在測試 NMT 系統過程中,工程師要使用訓練數據集中沒有的語句進行測試,以確保系統在處理外部數據時也能正常工作。
強大的神經網絡來源于強大的數據

引入海量數據后,深度神經網絡的表現超過了其他模型

神經網絡近期獲得的成功源于大規模數據的出現。當有了足夠多的數據作支撐,深度神經網絡的提升尤為明顯。同時,網絡達到足夠的深度,NMT 系統翻譯的語句相比于過去技術翻譯的結果也更為流暢。這里的“流暢”是指,輸出的文本不會過于生硬,甚至有時候會被認為是人工翻譯的結果。

NMT 存在什么問題?

回想文章開頭提到的幾個題目 -- NMT 聽起來極其卓越,但它真的可以與人工翻譯相比嗎?根本不可能。事實上,與人類相比 NMT 在很多方面都存在缺陷。

這些缺陷可歸為三類:可靠性、記憶力和判斷力。

可靠性:這可能是最令人擔憂的一點,NMT 翻譯并不可靠。NMT 系統無法保證準確度,常常出現漏掉否定詞、整個單詞甚至整個短語的情況。

記憶力:NMT 系統還有嚴重的短期記憶缺陷。目前,我們所建立的系統每次只能翻譯一句話,導致其忽略了上文中可能包含的信息

判斷力:NMT 系統對外部的信息與知識幾乎沒有判斷能力。對翻譯工作來說,把握一段內容在特定語境中的理解是很重要的,但對機器來說這很難做到。

在接下來的內容里,我會闡述有關這三個缺陷的細節。

可靠性

NMT 無法檢查其輸出的信息是否真實。例如,NMT 系統可能漏掉否定詞或整段信息。這些錯誤會導致什么后果呢?

“The US did not attack the EU! Nothing to fear,”

這是著名報紙 Le Monde 中用法語報道的內容,然后機器翻譯成英語的結果是:

“The US attacked the EU! Fearless.”

試想象,如果這樣錯誤的翻譯遍布互聯網,在假新聞病毒式傳播之前我們來得及更正嗎?令人沮喪的是,這樣的災難幾乎無法挽回。

▌記憶力

當前的 NMT 系統還有一個明顯的不足:每次只能單獨翻譯一個句子。這意味著機器并不知道它們當前翻譯的句子之前的內容。而作為人類,我們閱讀文章的時候會聯系上下文。

那么為什么我們在訓練 NMT 系統時,每次只用一個句子而不是整段文檔呢?這里面有技術原因:首先,對神經系統來說,讀取一段長文檔,儲存所有信息并快速調用都很困難;其次,當輸入的信息量過大時,系統運行的時間也會更長。所以為了提高效率,我們在訓練過程中都使用了單獨的語句。

總之,不能聯系上下文是 NMT 的主要問題,尤其對于翻譯一個故事來說至關重要。講故事是人類的行為,是創造力、智慧和表達的結合,也因此將我們與動物區分開來。如果 AI 翻譯系統連有條理地翻譯一個故事都做不到,更不用說文法上是否優雅,怎么能說它們達到了人類的水平呢?

▌判斷力

假設你在讀一篇關于音樂會的文章,然后使用 NMT 系統把英語翻譯成法語,發給了你講法語的朋友。在英文原文中,文章記錄了對許多音樂會參與者的采訪,其中包括一位年輕人的感慨:

“I’m a huge metal fan!”

但這句話被翻譯成了:

“Je suis un énorme ventilateur en métal” (“I’m a large ventilator made of metal.”)

在這篇文章中,系統并不知道 "metal fan" 是指熱愛金屬音樂的一類人,直接翻譯成了由金屬制造的通風裝置。

這個問題在機器發展初期就存在了,但至今無法解決。早在 1958 年的相關論文中就提到了該問題,這里有一個經典的例子:

The box was in the pen.

對此 NMT 系統會被 "pen" 這個單詞困擾:它在這里指寫字的工具還是圍欄呢?

對 NMT 系統來說,關于世界的常識知識對翻譯來說尤為重要。然而,對這些知識全部進行編碼以及從大量數據中提取都是很困難的。我們需要一個有自主判斷力的機制,并將常識知識引入到神經網絡中。

什么是好的翻譯?

我們應該如何評估機器翻譯系統的水平?目前,最常用的方法是 BLEU score。我們把機器翻譯出的內容與人工翻譯的內容做對比,分別計算其 BLEU 分數。如果機器翻譯結果中的單詞和短語與人工的結果相似度很高,那么系統就會得到較高的 BLEU 分數。

BLEU score 是一種簡單卻有效的翻譯評估方法,尤其在評估性能低的系統時。然而研究者發現,BLEU score 也經常與人類的觀點不同。這意味著 BLEU 指標只能在若干低性能系統中挑選出最佳的一個,而面對性能更好的系統進行評估時比較吃力。

相比于 BLEU 評估方法,對翻譯結果直接進行人工評估的方法更加出色,但也并非沒有缺點。關于人工對機器翻譯進行評估,存在兩個不可忽視的問題:

人工評估不是自動的,所以成本較高且效率低。

人工評估往往會出現分歧。這個問題不僅存在于 BLEU 方法與人類之間,也存在于人類評估者之間。

總地來說,雖然人工評估效果更好,但它需要很高的成本,同時要求盡量不能出錯。進一步來說,在將 NMT 系統與人類譯者做對比時,要考慮到評估機制的限制因素。

我們仍在繼續努力!未來會如何發展?

NMT 正在飛速發展,新的進步與突破也在被頻繁報道著。新的研究正致力于解決以上提出的所有問題:可靠性、數據偏差、無意義輸出、記憶力、對常識的判斷力以及評估標準。

過去幾年,NMT 在表現和效率方面都有所突破。這源于新系統不再需要連續處理數據,如按照從左到右或從右到左的順序,從而使我們可以同時訓練更多的數據,最后生成更合理的翻譯結果。

同時,我們可以期待會有越來越多關于新研究的報道。哈佛的 OpenNMT -- 一個可用于 LuaTorch、PyTorch 和 Tensorflow 的開源神經機器翻譯工具包,正在迅速融入新的方法,以便于大家可以建立最好的翻譯系統。由前谷歌研究員開發的新型商業系統 deepL,聲稱已經超越谷歌的翻譯系統。這是一個發展迅速的領域,這也是一個見證 NMT 不斷突破的時代。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6173

    瀏覽量

    105640
  • AI
    AI
    +關注

    關注

    87

    文章

    31155

    瀏覽量

    269494
  • 人工智能
    +關注

    關注

    1792

    文章

    47442

    瀏覽量

    239018

原文標題:為什么AI的翻譯水平還遠不能和人類相比?

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    人類智慧水平AI即將到來,AI芯片已提前布局

    擁有人類智慧水平AI即將出現,但不必恐懼,Altman認為這種AI對世界的影響沒有人們想象得那么嚴重。 ?
    的頭像 發表于 01-22 06:44 ?2626次閱讀

    馬斯克預言:AI將全面超越人類智力

    ,到2025年底之前,AI的智力水平將有望超越單個人類的智力。而到了2027年至2028年間,AI超越所有人類智力的可能性正在迅速增大。更令
    的頭像 發表于 12-28 14:23 ?223次閱讀

    再添殊榮!移通信工業智能品牌寶維塔?斬獲AI創新應用獎

    12月24日,2024中國物聯網產業大會暨第21屆慧聰品牌盛會在深圳圓滿落幕。會上,移通信憑借其工業智能品牌寶維塔在推動AI技術落地與應用創新方面的卓越貢獻,獲頒“AI創新應用獎”。作為科技發展
    的頭像 發表于 12-25 19:04 ?268次閱讀
    再添殊榮!移<b class='flag-5'>遠</b>通信工業智能品牌寶維塔?斬獲<b class='flag-5'>AI</b>創新應用獎

    IMAX攜手Camb.AI實現影院實時語言翻譯

    近日,據外媒最新報道,國際知名影院品牌IMAX與總部位于迪拜的人工智能初創公司Camb.AI宣布達成戰略合作,旨在為全球影院觀眾帶來前所未有的實時語言翻譯體驗。 此次合作的核心目標是將IMAX的原創
    的頭像 發表于 11-26 13:55 ?412次閱讀

    阿里國際發布翻譯大模型Marco

    近日,阿里國際正式推出了其翻譯大模型——Marco。這款模型已在阿里國際AI官網Aidge上線,并向全球用戶開放使用。
    的頭像 發表于 10-17 16:07 ?299次閱讀

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    人們對AI for Science的關注推向了高潮。 2. 跨學科融合與科學研究新范式 AI與生命科學的結合,不僅推動了生命科學本身的進步,促進了多個學科之間的交叉融合。這種跨學科的合作模式,打破
    發表于 10-14 09:21

    平衡創新與倫理:AI時代的隱私保護和算法公平

    機制,包括了數據的來源、處理方式以及使用目的的明確披露。這樣不僅有助于監管機構進行審查,也讓普通用戶能夠理解AI系統的決策依據,從而減少因“黑箱操作”帶來的不信任和誤解。例如,在AI輔助醫療診斷中
    發表于 07-16 15:07

    超ChatGPT-4o,國產大模型竟然更懂翻譯,8款大模型深度測評|AI 橫評

    、速度慢、費用高且難以準確理解上下文”的問題。相比之下,AI大模型憑借其強大的學習能力和適應性,在翻譯質量、效率、上下文理解和多語言支持等方面表現出色,提供了更加
    的頭像 發表于 07-14 08:04 ?128次閱讀
    超ChatGPT-4o,國產大模型竟然更懂<b class='flag-5'>翻譯</b>,8款大模型深度測評|<b class='flag-5'>AI</b> 橫評

    智謀紀 AI+Multi LED 打開人類健康新寶藏

    技術。 智謀紀創始人&CEO朱東亮先生受邀出席論壇,帶來題為《AI+ Multi LED,打開人類健康新寶藏》的專題演講。 演講精彩瞬間回顧:AI+ Multi LED,智謀紀AI照明
    的頭像 發表于 06-17 12:23 ?344次閱讀
    智謀紀 <b class='flag-5'>AI</b>+Multi LED 打開<b class='flag-5'>人類</b>健康新寶藏

    Netflix CEO:搶你飯碗的不是AI,而是熟練使用AI的人

    在《紐約時報》采訪中,薩蘭多斯強調道:“我并不相信AI可以超越頂級編劇的水平,也不能預見AI能取代優秀演員的日子,同時也不能想象我們未來無法
    的頭像 發表于 05-28 16:03 ?385次閱讀

    日本新政企合作計劃:AI助力漫畫翻譯,力圖出口量翻兩番

    據悉,日本經濟產業省旗下的日本創新網絡公司(JIC)等十家企業,連同本土出版巨頭“小學館”共同向AI翻譯漫畫初創公司Orange注資29.2億日元(約合1.36億元人民幣)。
    的頭像 發表于 05-08 16:02 ?415次閱讀

    富士通發布最新的人工智能(AI)戰略,聚焦深化人類AI之間的協作

    富士通株式會社(以下簡稱“富士通”)發布了最新的集團人工智能(AI)戰略,聚焦深化人類AI之間的協作,并提出了將AI作為“可信賴的助手”這一愿景,為提升
    的頭像 發表于 02-21 17:09 ?862次閱讀
    富士通發布最新的人工智能(<b class='flag-5'>AI</b>)戰略,聚焦深化<b class='flag-5'>人類</b>與<b class='flag-5'>AI</b>之間的協作

    奧特曼稱相信AI無法替代人類

    奧特曼稱相信AI無法替代人類 AI對于人類的威脅一直有很多討論,各有不同觀點,很多人對于科幻電影中的場景AI機器人傷害
    的頭像 發表于 01-19 11:43 ?885次閱讀

    OpenAI CEO稱人類水平AI即將出現

    OpenAI首席執行官山姆·奧特曼(Sam Altman)近日表示,達到人類水平的人工智能(AI)即將出現,但他認為這種技術對世界的影響可能沒有人們想象的那么大。
    的頭像 發表于 01-17 14:59 ?856次閱讀

    墨芯人工智能CEO王維:需要重新定義和設計AI計算機

    AI時代,我們需要重新定義和設計AI計算機。僅依靠硅基的摩爾定律,2年翻一倍的線性增長的算力供給不能滿足指數級增長的需求問題。
    的頭像 發表于 01-12 11:12 ?1106次閱讀
    主站蜘蛛池模板: 影888午夜理论不卡| 中字幕视频在线永久在线| 久久精品亚洲| 久草在线福利资站免费视频| 极品美女穴| 快播电影网站大全| 欧美性黑吊xxx| 偷窥 亚洲 色 国产 日韩| 亚洲乱码一区二区三区香蕉 | 粉嫩自拍 偷拍 亚洲| 国产精品爽爽久久久久久无码| 国产精品av| 蝴蝶中文娱乐| 美国特级成人毛片| 日本高清免费一本视频在线观看| 青青草原直播| 亚洲精品国产高清嫩草影院| 中文字幕成人| 大陆午夜伦理| 精品免费久久久久久影院| 免费观看男生桶美女私人部位| 人驴交f ee欧美| 亚洲人视频在线观看| av色天堂2018在线观看| 国产欧美日韩综合精品一区二区 | 含羞草在线免费观看| 久久免费视频1| 三级黄色在线| 中文字幕成人免费高清在线| 大胸美女裸身色诱网站| 精品国产品在线18年| 热久久2018亚洲欧美| 亚洲中字幕永久在线观看| 成人国产在线24小时播放视频| 红番阁免费观看| 全黄H全肉禁乱公| 最新无码二区日本专区| 国产精品外围在线观看| 欧美成人无码视频午夜福利| 亚洲欧美综合中文| 国产99网站|