色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

無法被AI識別翻譯的古老語言,將去何方?

如意 ? 來源:OFweek電子工程網 ? 作者:學術頭條 ? 2020-10-26 11:14 ? 次閱讀

語言是文化的有機組成部分,也是文化的載體,世界文明的多樣性在很大程度上表現為世界語言的多樣性。而在 21 世紀的今天,語言學家們顯然已經不滿足于傳統的、對已知語言的研究。相反,許多科學家開始利用計算機技術,去探索已經消失的、幾乎成為謎底的滅絕古老語言。

近日,麻省理工學院計算機科學與人工智能實驗室(Computer Science and Artificial Intelligence Laboratory 簡稱 CSAIL)的研究人員就開發出一種計算機算法,旨在幫助語言學家破譯歷史上已消失的語言。

無法“谷歌翻譯”的古老語言

如今,世界上現存約有 7100 種語言。然而,古時存在的大多數語言都已不再使用,幾近滅絕。數十種已滅絕語言也被認為是“未破譯”的語言,也就是說,我們對它們的語法(grammar)、詞匯(vocabulary)或句法(syntax)了解不足,也無法理解其文本的意思。

圖 | 世界語言分布地圖 2018

而研究這些“未破譯”的語言,不僅僅是處于學術上的好奇心。還是因為,不理解語言,我們就會錯過與講這些語言的人有關的一整套知識體系。不幸的是,大多數滅絕語言的相關記錄極少,因此,科學家無法使用谷歌翻譯之類的機器翻譯工具或AI算法來對其進行解密。

而傳統的研究方法是,找出目標語言的“相關”語言來作比較研究,例如同一語系或相似度較高的現存語言。然而,有些語言并沒有對應的、已被深入研究過的“相關”語言,并且它們通常缺少諸如空格和標點符號之類的傳統分隔符(想像一下,要解密出用這種語言寫出的文字該有多么令人頭禿)。

但是,CSAIL 的研究人員發明的新系統,已被證明能夠自動破譯消失的語言,且無需對其與其他語言的關系有深入的了解。他們還表明,該系統自身就可以確定語言之間的關系,并可以用它來證實最近的一項表明 Iberian 語言實際上與 Basque 語言無關的學術研究。

語言破譯:從文本到矢量的轉變

此研究由 MIT 教授 Regina Barzilay 牽頭,依賴于基于歷史語言學(historical linguistics)見解的幾項原則。其中一條原則是,一種給定的語言很少會直接添加或刪除整個音節,但是很可能會發生某些近似發音的替換。比如,母語中帶有“ p”發音的單詞可能會在其后代演變中變為“ b”,但是由于明顯的發音差異,變為“ k”的可能性則較小。

通過整合這些原則和其他語言學約束,Barzilay 等人的新算法學習將語言發音嵌入多維向量空間,在該多維空間中,相應矢量之間的距離反映了不同發音的差異。這種設計使他們能夠捕獲語言變化的相關特征,并將這些特征表達為計算約束(computational constraints)。因此,它可以評估兩種語言之間的相似度。實際上,當對已知語言進行測試時,它甚至可以準確地識別出該語言屬于哪個語系(language families)。例如英語、德語同屬于日耳曼語系。

不僅如此,算法生成的模型可以將古語言中的單詞進行細分,并將其一一映射到“相關”語言中的對應單詞上去。研究團隊的最終目標是使該系統僅僅使用幾千個單詞,就能夠破譯數十年來語言學家們都無法理解的古語言。

機器翻譯相關研究

實際上,這并非 MIT 首個使用計算機技術破譯已消失語言的研究。

早在 2010 年,Barzilay 就和其他合作者一起,開發出一個新的計算機算法,該算法在幾個小時內就破解了古老的猶太語言烏加里特語(Ugaritic)。除了幫助破譯“神秘的”八種左右古老語言外,這項工作還可以擴大自動翻譯系統可以處理的語言數量。例如目前,谷歌翻譯支持103種語言,而破譯系統中使用的技術可以幫助其為數千種語言構建詞典。

去年,Barzilay 等人也發表過一篇論文,文中使用改進的計算機算法破譯了線形文字 B(Linear B,出現在公元前 1400 年左右)。他們說,“我們的翻譯腳本能夠以 67.3%的準確率將線性文字 B 的同源詞轉換成對應的希臘語。據我們所知,該試驗是自動解讀線性文字 B 的第一次嘗試。”

在未來的工作中,該團隊希望擴展到將文本與已知語言的相關單詞相關聯的范圍之外,這種方法被稱為“基于同源的破譯方法”。

Barzilay 說:“例如,我們可以識別文本中涉及到的所有人或地點的信息,然后可以根據已知的歷史證據對其進行進一步的調查。這些實體識別(entity recognition)方法如今已廣泛用于各種文本處理應用程序中,并且具有很高的準確性 。”
責編AJX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6177

    瀏覽量

    105693
  • 算法
    +關注

    關注

    23

    文章

    4624

    瀏覽量

    93119
  • AI
    AI
    +關注

    關注

    87

    文章

    31294

    瀏覽量

    269655
收藏 人收藏

    評論

    相關推薦

    TSW14J56EVM無法HSDC Pro軟件識別是哪里出了問題?

    近期購買了一批TI公司的器件,其中包括4塊TSW14J56EVM的板子,經測試發現,有一塊板子無法HSDC Pro軟件識別,即板子無法與PC無法
    發表于 12-13 08:21

    LLMWorld上線代碼翻譯新工具——問丫·碼語翻譯俠,快來體驗!

    01. 工具介紹 aicode.llmworld.net 問丫·碼語翻譯俠 是一款由LLMWorld新推出的代碼翻譯工具,支持各種語言之間的翻譯,包括計算機
    的頭像 發表于 12-09 11:11 ?341次閱讀
    LLMWorld上線代碼<b class='flag-5'>翻譯</b>新工具——問丫·碼語<b class='flag-5'>翻譯</b>俠,快來體驗!

    IMAX攜手Camb.AI實現影院實時語言翻譯

    近日,據外媒最新報道,國際知名影院品牌IMAX與總部位于迪拜的人工智能初創公司Camb.AI宣布達成戰略合作,旨在為全球影院觀眾帶來前所未有的實時語言翻譯體驗。 此次合作的核心目標是將IMAX的原創
    的頭像 發表于 11-26 13:55 ?424次閱讀

    USB驅動問題:設備無法識別的全面指南!

    今天我把USB驅動問題,關于設備無法識別方面做一個全面指南供大家參考。連接USB無法識別模組設備,是不是驅動問題?今天就一起來聊聊如何排查解決。
    的頭像 發表于 11-26 12:35 ?439次閱讀
    USB驅動問題:設備<b class='flag-5'>無法</b><b class='flag-5'>識別</b>的全面指南!

    語音識別與自然語言處理的關系

    在人工智能的快速發展中,語音識別和自然語言處理(NLP)成為了兩個重要的技術支柱。語音識別技術使得機器能夠理解人類的語音,而自然語言處理則讓機器能夠理解、解釋和生成人類
    的頭像 發表于 11-26 09:21 ?507次閱讀

    如何在STM32f4系列開發板上部署STM32Cube.AI

    已下載STM32Cube.AI擴展包,但是無法使用,感覺像是沒有部署AI模型,我是想要通過攝像頭拍照,上傳圖像后,經過開發板處理器進行AI模型處理
    發表于 11-18 09:39

    PCM2707為什么無法電腦識別

    現在只焊接了最基礎的部分,其它如控制跟I2S接口都還沒連接元件,相當于空接,,現在無法電腦識別,系統WI8-64BIT,我購買的PCM2704的板可以電腦正常
    發表于 11-06 06:25

    DeepL推出新一代翻譯編輯大型語言模型

    在人工智能與語言處理領域,DeepL再次以其創新實力引領潮流,宣布成功推出新一代面向翻譯與編輯應用的大型語言模型。這一里程碑式的進展,不僅鞏固了DeepL作為頂尖語言人工智能公司的地位
    的頭像 發表于 07-19 15:56 ?707次閱讀

    menucofig在win11下指令無法識別是什么原因?

    。 問題有兩個,如下: 1.一個是工具啟動時出現 \"\\e was unexpected at this time.\" 這段話,不清楚什么意思? 2.menuconfig指令無法識別,不清楚原因?
    發表于 07-15 06:20

    超ChatGPT-4o,國產大模型竟然更懂翻譯,8款大模型深度測評|AI 橫評

    、速度慢、費用高且難以準確理解上下文”的問題。相比之下,AI大模型憑借其強大的學習能力和適應性,在翻譯質量、效率、上下文理解和多語言支持等方面表現出色,提供了更加
    的頭像 發表于 07-14 08:04 ?128次閱讀
    超ChatGPT-4o,國產大模型竟然更懂<b class='flag-5'>翻譯</b>,8款大模型深度測評|<b class='flag-5'>AI</b> 橫評

    自然語言處理技術的原理的應用

    自然語言處理(Natural Language Processing, NLP)作為人工智能(AI)領域的一個重要分支,旨在使計算機能夠理解和處理人類自然語言。隨著互聯網的普及和大數據技術的發展
    的頭像 發表于 07-02 12:50 ?599次閱讀

    stm32下載了個usb dfu的例程,usb無法識別的原因?

    網上下載了個 usb dfu的例程但是usb無法識別 。使用的硬件是神舟3號開發板。硬件已經使用神舟3的SD卡例程測試 usb可用。 求助!!!!!!!!!!!!!!!!
    發表于 05-17 16:05

    Meta探索開發AI耳機:識別物體和翻譯外語

    據外媒The Information透露,Facebook母公司Meta正積極研究研發配備攝像頭的人工智能耳機,旨在實現物體識別與外語實時翻譯功能。
    的頭像 發表于 05-14 14:26 ?529次閱讀

    Gentoo理事會嚴控應用AI自然語言工具生成內容

    現有的LLM(大型語言模型)擅長生成看似合理卻缺乏實際價值的內容。盡管謹慎使用時能夠提供有效幫助,但我們無法完全依賴這些工具。這可能導致Gentoo項目質量下降,同時增加開發者和用戶的審核負擔,以識別因使用
    的頭像 發表于 04-17 10:13 ?368次閱讀

    開發者手機 AI - 目標識別 demo

    功能簡介 該應用是在Openharmony 4.0系統上開發的一個目標識別AI應用,旨在從上到下打通Openharmony AI子系統,展示Openharmony系統的AI能力,并為
    發表于 04-11 16:14
    主站蜘蛛池模板: bl高h文合集| 学校女性奴sm训练调教| 亲胸揉胸膜下刺激视频在线观看| 午夜国产福利| 最近中文字幕MV免费高清在线| 俄罗斯兽交XXXXX在线| 久久三级视频| 无码内射成人免费喷射| 97在线超碰免费视频| 饥渴的新婚女教师| 我们中文在线观看免费完整版| av无码在线日本天堂| 精品在线观看一区| 午夜亚洲WWW湿好爽| 超碰免费视频公开97| 美国xaxwaswaskino| 亚洲三级在线视频| 国产精品一区二区四区| 日日a.v拍夜夜添久久免费| 99热久久视频只有精品6| 老师xxxx69动漫| 在线 国产 欧美 专区| 黑丝美女娇喘| 亚洲 日韩 在线 国产 精品| 国产 交换 丝雨 巅峰| 漂亮的保姆6在线观看中文| 2012中文字幕手机在线| 九九热视频这里只有精| 亚洲另类国产综合在线| 国产在线精品亚洲第1页| 午夜福利免费0948视频| 古风H啪肉NP文| 睡觉被偷偷进入magnet| 国产成人免费| 婷婷四房播客五月天| 国产成人精品自拍| 色噜噜狠狠一区二区三区| 高清欧美videos sexo| 乳女教师欲乱动漫无修版动画| 俄罗斯12x13x处| 少妇连续高潮抽搐痉挛昏厥|