一家德國初創(chuàng)企業(yè)推出的翻譯軟件DeepL在翻譯水平上讓不少用戶驚艷。與之相比,市場(chǎng)上其它通用翻譯軟件相形見絀。德國人做了什么與眾不同的事?
權(quán)威的德國朗氏字典已經(jīng)成為“老黃歷”?
涉足翻譯軟件的IT巨頭如谷歌和微軟面對(duì)的這個(gè)競(jìng)爭對(duì)手雖小,但實(shí)力不輸。與谷歌翻譯等相比,來自德國科隆的初創(chuàng)企業(yè)DeepL的軟件翻出的文字語句流暢自然得多。這家由一名前谷歌員工創(chuàng)建的公司與其它競(jìng)爭對(duì)手比起來,有一個(gè)明顯的優(yōu)勢(shì)。
這一產(chǎn)品運(yùn)用了以人工神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的所謂深度學(xué)習(xí)(Deep Learning)技術(shù)。為此,DeepL的研發(fā)者利用了一個(gè)現(xiàn)有的在線服務(wù)數(shù)據(jù)庫。
從字典到翻譯器
2009年,這家公司的在線雙語詞典Linguee.com上線。它的不同之處在于,除了列出詞匯的各種翻譯選項(xiàng),還給用戶提供大量來自現(xiàn)有原文的雙語對(duì)照例句。
這些例句是由一種叫網(wǎng)絡(luò)爬蟲(Web-Crawler)的特殊網(wǎng)絡(luò)機(jī)器人從互聯(lián)網(wǎng)上搜集來的。許多例句來自歐盟等多邊國際機(jī)構(gòu)的官方文件。
一種經(jīng)人工訓(xùn)練的學(xué)習(xí)算法對(duì)搜集來的文句的結(jié)構(gòu)和含義進(jìn)行分析計(jì)算,以期掌握特定的概念在外語中如何表達(dá)。此外用戶還可以在Linguee字典應(yīng)用中留下自己的反饋,并對(duì)翻譯結(jié)果作評(píng)估。過去9年中,通過數(shù)量不斷增加的高質(zhì)量翻譯文庫,Linguee應(yīng)用一直在得到完善。這也逐漸成為新的翻譯工具DeepL的基礎(chǔ)。
DeepL--深度學(xué)習(xí)
DeepL是deep learning的縮寫,意思是深度學(xué)習(xí)。這是人工智能的一個(gè)方面,即模仿人類學(xué)習(xí)的方式。從前,編程員給每項(xiàng)任務(wù)編寫單獨(dú)的指令,由計(jì)算機(jī)去完成。現(xiàn)在,人們則打造一個(gè)人工神經(jīng)網(wǎng)絡(luò),通過輸入現(xiàn)有的范例可以對(duì)它進(jìn)行訓(xùn)練。范例越多,電腦就能學(xué)得越好。對(duì)大量數(shù)據(jù)進(jìn)行處理的技術(shù)可能,讓這一機(jī)器學(xué)習(xí)的潛力得到進(jìn)一步拓展。
DeepL上的英德互譯
從技術(shù)上看,深度學(xué)習(xí)是一種結(jié)合運(yùn)用多個(gè)層面信息處理的算法。"深度"指的是數(shù)據(jù)穿越的層級(jí)的數(shù)量。這一技術(shù)如今已運(yùn)用于無人駕駛汽車、虛擬實(shí)境視聽裝置和人臉識(shí)別系統(tǒng)。現(xiàn)在它也被運(yùn)用到了自動(dòng)翻譯中。
不光是學(xué)習(xí)
過去兩年中在這一領(lǐng)域中,DeepL不是唯一運(yùn)用深度學(xué)習(xí)技術(shù)的企業(yè)。互聯(lián)網(wǎng)巨頭谷歌、微軟和Yandex也在嘗試。不過DeepL與它們有所不同。
首先,人工神經(jīng)網(wǎng)絡(luò)的運(yùn)行能力的基礎(chǔ)是訓(xùn)練所使用的原始資料的質(zhì)量。在此,DeepL得益于"大哥"Linguee,后者提供了數(shù)以十億計(jì)的高質(zhì)量翻譯例句范文。
"Linguee的數(shù)據(jù)是高質(zhì)量的訓(xùn)練素材",DeepL公司的發(fā)言人科達(dá)(Lee Turner Kodak)介紹說。他強(qiáng)調(diào),DeepL成功的背后還不僅僅是數(shù)據(jù)的質(zhì)量,"我們的研究人員熟悉這一領(lǐng)域的最新發(fā)展,開發(fā)了獨(dú)一無二的神經(jīng)網(wǎng)絡(luò)架構(gòu)。"
這一技術(shù)到底具體是如何構(gòu)成的,是這家企業(yè)的秘密。DeepL可不想失去市場(chǎng)領(lǐng)先地位。
比谷歌翻譯不止強(qiáng)一倍
為了檢驗(yàn)翻譯的質(zhì)量,公司定期進(jìn)行隨機(jī)盲測(cè),以保證應(yīng)用軟件的高水準(zhǔn)。2017年8月進(jìn)行的一次盲測(cè)的結(jié)果驗(yàn)證了DeepL自己設(shè)立的目標(biāo),即成為"世界上最好的翻譯機(jī)器"。測(cè)試比較了DeepL、谷歌、微軟和臉書的翻譯功能。
人們分別給這幾款翻譯軟件輸入100個(gè)英文句子,讓其翻譯成德、法、西班牙語,同時(shí)也讓它們將這三種文字的例句譯成英語。然后由專業(yè)翻譯對(duì)譯文的質(zhì)量進(jìn)行評(píng)估。結(jié)果是,DeepL的答案被選為最佳譯文的頻率是谷歌的三倍,因?yàn)樗鼈兟犉饋砀匀弧?/p>
來自硅谷的投資
2018年12月初,DeepL宣布迎來了新的投資人--來自硅谷的風(fēng)投公司Benchmark。發(fā)言人科達(dá)表示,DeepL計(jì)劃建立一支25人的團(tuán)隊(duì),在一年內(nèi)將研發(fā)投入翻一番。
他說:"這個(gè)伙伴關(guān)系不僅意味著資金,還有人脈。我們將從投資人和其它創(chuàng)業(yè)公司的商業(yè)智能(BI)中學(xué)習(xí)到東西,他們?cè)谘邪l(fā)進(jìn)程中走得比我們遠(yuǎn)。"
100種語言對(duì)9種
2018年12月5日,DeepL新推出了俄語和葡萄牙語的翻譯服務(wù)。現(xiàn)在這一翻譯軟件已支持9種歐洲語言互譯,共有72種組合可能。谷歌翻譯則已覆蓋100種語言。不過作為初創(chuàng)企業(yè),DeepL更注重翻譯的高質(zhì)量,它的創(chuàng)立者相信,質(zhì)量比數(shù)量更重要。
公司發(fā)言人科達(dá)說:"我們要成為最好的機(jī)器翻譯系統(tǒng)。我們也希望能為每一種語言提供翻譯。但不是一下子拋出好幾百種,為了有而有。我們會(huì)先訓(xùn)練我們的網(wǎng)絡(luò),讓它們能始終提供高質(zhì)量的翻譯。這也是我們創(chuàng)出名氣的原因所在。"
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4777瀏覽量
100997 -
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3842瀏覽量
64567 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5511瀏覽量
121376
原文標(biāo)題:秒勝谷歌翻譯 德國初創(chuàng)公司有絕招
文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論