大語言模型LLM是這幾個月熱度最高的全球明星。目前看來,AI逐漸走向復雜專業的白領型崗位,已經是必然的趨勢。
OpenAI剛剛發布的35頁論文中,提到了最容易受到LLM影響的職業中譯員和筆譯員排名第二。
以前機器翻譯就是出國旅游時拍拍路標、看看菜譜,現在GPT-4連學術論文里的復雜長難句、專業術語都能理解,“人肉翻譯”越來越沒優勢。
生成式AI能直接模擬已故的翻譯家,輸出大師風格的譯文,一般人做翻譯還有什么前途?
調用ChatGPT翻譯一本中等部頭的英文書,只需要花大概十個小時、四美元,人工翻譯卷到天際也達不到這樣的性價比……
這段時間,外語專業學生和翻譯從業者們有類似心情的人不在少數。
根據中國翻譯協會的調查,中國的翻譯人才的規模是538萬人,其中本科以上的中青年為主,這些年輕、專業、高素質的人才如果離開了翻譯行業,豈不可惜?
所以,我們應該盡快回答這些問題:AI時代,我們為什么還需要人工翻譯?翻譯人才要怎么跨入AI的大門?譯者+機器的人機協作,有哪些必要條件?
幸好,翻譯行業的反應速度遠比我們想象得快。4月3日至4日,2023中國翻譯協會年會舉辦,百度翻譯聯合中國外文局翻譯院、中國翻譯協會翻譯技術委員會,共同發布了《2023機器翻譯技術及產業應用藍皮書》。
《藍皮書》系統闡述了機器翻譯的發展歷程和方向,介紹了產業級機器翻譯系統和產品形式,并通過實際案例展示了機器翻譯產業應用現狀,對機器翻譯未來發展提出建議。為推動機器翻譯技術與各行業的深度融合提供有益借鑒,為機器翻譯技術的產業應用提供有力支持,其客觀、全面、權威的信息,也成為翻譯人才把握當下趨勢的權威參考。
同時,在譯協年會上,由百度翻譯提供技術和平臺支持的“首屆全國翻譯技術大賽”正式啟動,預計賽制持續到8月,也為中國翻譯人才擁抱技術提供了競技舞臺和窗口期。
沒有人會懷疑,我們正處在一個非常重要的歷史轉折點。面對大語言模型等最新AI技術帶來的無數可能性,中國翻譯人才可以不焦慮、不盲目、有底氣的進入人機共譯新階段。
不焦慮:“見識過‘珍妮紡紗機’,我還是選擇當翻譯”
在翻譯行業工作多年的小A表示:太陽底下無新事,翻譯人見過的“AI威脅論”并不少。
2016年,翻譯領域就曾出現過類似的“珍妮紡紗機時刻”。當時,一篇名為《翻譯界的重大突破!作為一個翻譯,此刻我理解了18世紀紡織工人看到蒸汽機時的憂慮和恐懼!》的文章,傳遍了翻譯人的朋友圈。
不少譯員和外語系學生就像在手工棉紡織時代,看到了由蒸汽機帶動的珍妮紡紗機,能同時紡8卷線一樣,感到非常擔憂。
原來,百度于2015年發布了全球首個互聯網神經網絡機器翻譯系統。隨后,谷歌、微軟相繼部署了以神經網絡作為基礎的機器翻譯系統。這種機器翻譯技術,通過建立深度神經網絡模擬人類的翻譯過程,在語言表示、語義理解、譯文生成等方面有顯著進步,讓機器翻譯的質量大幅提升。結果呢?今天人類翻譯依然存在,而大眾使用翻譯服務的門檻則大大降低了。
更早一點,上世紀末的翻譯人,也曾遇到過“珍妮紡紗機”。九十年代,統計機器翻譯方法的出現,可以基于大規模語料自動訓練模型參數,這種方式不需要人工專家來構建翻譯規則,比基于規則的機器翻譯效率更高、效果更好,彌補了當時國內高水平的專業翻譯人才匱乏、不能滿足實際需求的問題,讓更多高質量的譯著走出了國門,走進大眾視野。
作為一種更古早的機器翻譯技術,基于規則的機器翻譯,其實也曾是人類眼中的“珍妮紡紗機”。上世紀五十年代,哪怕窮盡全球翻譯家們一生的力量,也只能掌握幾十種語言,譯著只占人類作品總量的冰山一角,通過計算機自動完成翻譯,解決全球溝通和交流的問題,也帶來了翻譯業態的快速發展。
把時間拉回到當下,以 ChatGPT、文心一言為代表的新一代預訓練模型技術,通過超大規模的數據和充分訓練實現了智能涌現效應,大幅提升了機器翻譯的魯棒性和容錯能力。
所以說,機器翻譯從來沒有真正消滅人工翻譯,這是歷史上被多次證明的,反而機器翻譯讓高質量翻譯人才的需求更加旺盛。
面對新的機器翻譯技術,翻譯人才對于“珍妮紡紗機”的恐懼,更多是源于對于自身發展的不確定。幸好,這種“不確定”正在被“國家隊”所改變。
在剛剛發布的《2023機器翻譯技術及產業應用藍皮書》中,中國翻譯協會的調研數據顯示,有超過 85% 的受訪者認為“機器翻譯 + 譯后編輯”的工作模式會在更大范圍內應用。
《藍皮書》認為,機器翻譯成為人類譯員的得力助手和有效補充,促使翻譯行業催生出更多如譯后編輯、機翻質量控制等新職業,正在多種場景中被應用。
簡單舉幾例:
1.加速短視頻、網絡文學等中國優質內容出海。人人譯視界助力 B 站的海外達人項目,完成三百多個頻道的譯制工作;晉江文學城、米讀小說 APP使用針對網絡文學垂直領域定制優化的機器翻譯系統,將大量本土網絡文學作品翻譯成英語、西班牙語、葡萄牙語等語種,獲得海外用戶的青睞。
2.助力企業海外市場經營。中石化的企業智能翻譯平臺,支撐境外財務票據核銷、重大項目審計、合規備案等翻譯工作;新華社的“新華絲路”, 引入智能翻譯平臺,輔助人工譯員提高翻譯效率。
3.支撐各行各業數字化建設。譯馬網引入“AI+人工” 的譯后編輯模式,日均翻譯字數可提升近 4倍,翻譯成本降低 34%;邁迪培爾開發的醫藥等垂直領域機器翻譯,為科研人員的研究工作提供了極大便利。
總之,翻譯領域的新機會還有很多,更詳細的信息,大家可以在《藍皮書》中閱覽。
機器翻譯大有用武之地,高端翻譯人才也是時代所需。二者相輔相成,可以滿足不同層次的翻譯需求,在獲取全球信息、對外交流等方面將發揮越來越重要的作用。
作為普通人,要做的是學習駕馭最新的“珍妮紡紗機”,把機器翻譯用好,不是留戀做一個“手工紡紗人”。
不盲目:從朦朧到清晰的人機協作之路
那么,“AI+人工” 的譯后編輯工作模式下,究竟怎樣才算用好AI技術?人機共譯,需要具備哪些技能?
《藍皮書》提供了方法論,呼吁培養 “翻譯 + 技術 +N”的精翻譯、懂技術、能力強的新時代高端翻譯人才。首屆全國翻譯技術大賽,則提供了具體的實現路徑。
要將AI技術和機器翻譯作為得力助手,人類譯員想要提高技能,也不能盲目。
“首屆全國翻譯技術大賽”,由中國外文局、全國翻譯專業學位研究生教育指導委員會指導,中國翻譯協會、中國外文局翻譯院、大連外國語大學主辦。百度翻譯作為承辦單位之一,提供翻譯技術與比賽平臺支持。
從陣容中不難看到,賽事為推動行業各方對機器翻譯技術的了解和應用,提供了清晰的方向和路徑:
1.清晰的培養方向。
舉辦方是百度翻譯,和翻譯行業的“國家隊”,保證了比賽涉及內容的前沿性和權威性,同時,賽事向各類翻譯愛好者開放,高校學生、翻譯機構、企業單位等都可以參與,人才覆蓋面廣。
由此證明,復合型翻譯人才的培養,AI+翻譯融合學科的建設,離不開政產學研用多方形成合力,提供更充沛的實踐機會和更明確的方向引導。
2.清晰的技能標準。
中國的翻譯人才要開啟“人機共譯”工作新范式,需要具備哪些核心能力?比賽考核點的設計,也給出了清晰的答案,讓人才能夠不再迷茫,提早培養自身的競爭力。
比如以往的翻譯比賽,主要考察人類譯文的準確性、優美性,而此次比賽,還將對機器翻譯的掌握,納入了考核,包括對機器翻譯軟件內置功能是否熟悉,操作熟練度如何,是否充分運用了技術,做到真正以賽促學,幫助大家掌握先進的機器翻譯工具。
(譯后編輯能力考察:術語替換題)
3.清晰的產業基石。
大賽由百度翻譯提供技術和平臺支持,背后也有著深度的考量:中國翻譯綜合能力的提高,要建立在怎樣的機器翻譯底座上?
選擇百度翻譯,一是技術領先,百度于2015年自主研發的全球首個互聯網神經網絡翻譯系統,能夠快速提高翻譯產能,是較為先進的機器翻譯工具。
二是平臺能力,百度智能文檔翻譯平臺的創新人機共譯模式,將機器翻譯(Machine Translation)+ 譯后編輯(post-editing)+ 模型自學習相結合,讓機器翻譯結果越用越準,效率不斷提升。
三是應用豐富。百度智能文檔翻譯平臺,提供術語參考、翻譯記憶、智能糾錯等功能,內置權威術語,查證更省力,在工作中真正為人類譯員減負。
從底層技術到上層應用的優勢,是百度智能文檔翻譯平臺“被選擇”的原因,也為翻譯行業和翻譯人才接下來的發展提供牢靠的支持。
翻譯人才如何跨入AI的大門,從首屆全國翻譯技術大賽開始,路徑正從朦朧走向清晰。
(產業級機器翻譯系統流程圖)
有底氣:從一群人的比賽,到全民的新可能
你可能會問:我又不當譯員,機器翻譯的發展跟我又有什么關系呢?
當然有。
從基于規則的機器翻譯,到大語言模型驅動的機器翻譯,機器翻譯技術的每一次更迭,都會讓全社會、全世界廣泛受益。
你讀到的一部譯本,與海外朋友的一次對話,境外旅游時的無礙溝通,前沿論文的快速傳播……翻譯成本不斷降低,以前需要請一個翻譯,現在手機app/翻譯筆就能搞定;體驗越來越絲滑,原本要分段復制粘貼的學術論文,現在整個丟進百度智能文檔翻譯,就能直出全部譯文,還帶還原版式,閱讀效率也高多了。
對于個人來說,跨語言溝通、學習和交流,是成長和進步的基礎,通過百度翻譯這樣的智能產品獲得更高質量、更低成本的翻譯服務,減少了很多不必要的時間和操作,某種程度上來說,是一種人生的提速。
對于企業來說,產品出海或跨境貿易,需要在翻譯上投入高成本,有時還不能快速到位,一些翻譯相關業務場景需要定制化開發,缺乏相應的人才。
《藍皮書》中提到國內某世界500強企業,需要通過海外媒體報道和電商渠道的消費者評論等信息,進行海外市場經營決策,涵蓋近百種語言,每月翻譯需求超百億詞,涵蓋文本、文檔、圖片等多種形態,海量而冗雜的翻譯任務,全靠人工根本沒辦法及時跟進最新市場動向。
中國企業要“走出去”,AI+機器翻譯,是必不可少的輔助。
百度翻譯從模型到應用的豐富能力,背靠百度生態,可與計算機視覺、語音處理等人工智能技術深度融合,全面、及時、深入響應不同行業不同場景的業務需求。
對國家來說,翻譯能力是國家軟實力的一部分。
中國外文局局長、中國翻譯協會會長杜占元指出,國家翻譯能力,是通過翻譯行為建構對外話語、開展文化傳播、塑造國家形象的綜合能力,是文化軟實力和國際傳播能力的重要組成部分,也是發揮大國作用、提升國際話語權的重要保障。
從這個角度看,加強國家翻譯能力建設,除了傳統手段之外,機器翻譯的技術領先性、安全性、可用性愈發重要。
百度在大模型技術、大語言模型(LLM)、自然語言處理(NLP)方面深耕多年的技術儲備和領先實力,從芯片、深度學習框架到翻譯模型的核心模塊自研能力,讓百度翻譯有望成為首屈一指的產業級機器翻譯系統,在翻譯行業智能化、數字經濟交流中發揮作用。
這些力量融合起來,才推動中國翻譯來到新的轉折點。而一個溝通無礙、高效的新世界,會讓一個人、一個企業、乃至一個國家,都獲得新的機會與可能。
1999年,萬維網的發明者、互聯網之父Tim Berners-Lee,就曾提出過一個概念:social machine(社會機器),即人與機器的協作體。人負責創造,而機器負責執行。當時,最熱的機器是家用電腦,全國都興起一股“電腦熱”,各種電腦培訓班、電腦操作書籍紛紛問世,和今天的“AI熱”差不多。
如果你不會恐懼電腦、抗拒電腦,那當然也不應該恐懼AI。AI時代,我們仍然需要人類譯者,語言的通天塔一天沒有越過,翻譯的火種便會生生不息。
個人對機器翻譯的不同態度和選擇,將迎來不同的命運,但愿你的選擇,映射的是你的希望,而非恐懼。
-
AI
+關注
關注
87文章
30736瀏覽量
268896 -
OpenAI
+關注
關注
9文章
1079瀏覽量
6483 -
ChatGPT
+關注
關注
29文章
1558瀏覽量
7597
發布評論請先 登錄
相關推薦
評論