當前,隨著經濟、文化互動的全球化,主流或通用語言更加強勢,弱勢語言正瀕臨消亡。目前世界上大約有7000種語言,而據語言學家預測大部分將于本世紀末消失。如果一種語言消失了,與之對應的整個文明也將隨之滅亡;如不及時對弱勢語言采取措施,我們將失去對人類文化遺產完整記錄的機會。
眾所周知,語言是人類進行溝通交流的主要表達方式,也是文化的載體和重要表現形式,還是一個民族的血脈和精神家園。因此,民族語言(母語),尤其是少數民族語言的保護已經成為一項重要而迫切的工作,而這方面的工作大有可為。
中國著名學者周海中先生曾經指出:當今處于弱勢的民族語言正面臨著強勢語言、全球化、互聯網等的沖擊,其社會使用功能正處于逐漸弱化或消失的危險境地;保護民族語言,有利于人類文明的傳承和發展,也有利于民族團結、社會安定。
保護語言多樣性就是保護文化多樣性,而保護文化多樣性也是保護人類命運共同體的多樣性。可以說,民族語言不僅是民族存在的很重要的特征之一,也是民族文化傳承、發展、繁榮的重要載體,更是人類文明進步和社會和諧穩定的重要標志。
如今,人工智能(AI)在人們看來已經不再陌生了,大家都已親身感受到它對我們日常生活的影響:人臉識別、語音控制、無人駕駛、智能家居、智能機器服務等;但是其實,人工智能的使命遠遠不只是方便人類,更是守護地球文明。
在瀕危語言方面,語言記錄很大程度依賴人工,然而其結構復雜多變,想要歸納完整的語音變化、語義分析、語法分析等,單靠人力是不現實的。另外,被研究語言的采集、文本轉寫缺乏規范也存在許多具體困難。
目前,人們正在利用人工智能技術系統地研究瀕危語言,實現對其完整的記錄。人工智能技術可建立完善的語料庫,記錄內容包括:確定該語言的語音結構,分析該語言的句法結構,基本意義單位和主流語言的對應關系等。
運用語音識別、語音轉寫、語音合成等人工智能技術,口音與文字可以更好結合,實現瀕危語言的的語音輸入。如此一來,即使沒有文字的瀕危語言,也有條件轉換成主流語言文本,得以記錄與傳承。
前不久,美國著名未來學家托馬斯·弗雷先生提出了“全球語言檔案館”的設想;在那里,他利用了人工智能技術把不同的民族語言以視頻、音頻和書面文件的方式存檔。他目前已經聯合世界各地的學者收集了近4000種語言的數據,其中許多是瀕危語種。
弗雷先生將收集到的語言資料輸入到人工智能語言重建引擎,其能夠生成一個功能性的三維立體化身,將語言傳授給想要學習它的人。他表示,人工智能引擎將更進一步,填補任何語言空白,在需要時創建一種語言的書面形式,并提供語言之間的翻譯。
在中國,科大訊飛利用人工智能技術尋找瀕危語言中不同尺度的音節語義之間的關聯和模式,在超強算力的服務器的協同配合下,最終形成語音庫,實現了瀕危語言的留存。憑借先進的智能語音技術,該公司覆蓋多個少數民族語言及方言的語音系統已經得到實際應用。
中國的阿里巴巴AI Labs最近宣布,正式成立方言保護專項小組,投入1億元對漢語方言進行保護和開發。他們將以人工智能為技術手段,在全國范圍內逐步開展對方言的語音識別、語音合成工作,用科技永久保存方言。
對許多機構來說,維護數字語言數據并使其便于土著社區使用是一項挑戰。而加拿大第一民族文化委員會(FPCC)最近為了支持不列顛哥倫比亞省的土著語言、藝術、文化和遺產的復興,通過其First Voice平臺保存語言數據,制作教學程序和應用程序。
另外,First Voice的最新創新是一款鍵盤應用程序,可讓用戶在移動設備上輸入超過100種當地語言,包括社交媒體、電子郵件和文字處理。First Voices將其語言數據存儲在Nuxeo中,Nuxeo是一個開源的云本地內容服務引擎,集成了人工智能和機器學習。
澳大利亞ARC語言動態卓越中心(CoEDL)為了向生活在偏遠社區的兒童教授澳大利亞的土著語言,還開發了一種低成本、易于運輸的智能機器人Opie。當孩子們通過故事、游戲和課程學習時,Opie的眼睛會與他們互動,機器人會記錄下他們的語言技能,供老師跟蹤他們的學習情況。
另外,CoEDL與美國谷歌合作,為土著語言轉錄和構建人工智能模型,他們目前已經為20多種澳大利亞土著語言建立了人工智能模型。這要歸功于谷歌的開源人工智能平臺TensorFlow;這種機器學習技術為語言學家節省了數百萬個小時的時間來轉錄CoEDL超過4萬小時的錄音。
由于人工智能技術在語言存儲和學習方面的優勢,現在它在拯救瀕危語言的過程中變得空前重要。不過,想通過這一技術使這些語言得以保護還面臨很大的挑戰,例如許多土著語言一般是通過口述的方式進行傳承,如果將其轉化為文字,可能會改變或者無法完整地表達其原本含義。
我們完全可以相信,在現代科技,尤其是人工智能技術的助力下,民族語言的保護問題一定能夠得以解決。最后,筆者希望有越來越多的人和機構參與民族語言的保護工作,為建設語言生態文明和保護世界文化多樣性貢獻智慧和力量。
責編AJX
-
人工智能
+關注
關注
1792文章
47378瀏覽量
238882 -
語言
+關注
關注
1文章
97瀏覽量
24263
發布評論請先 登錄
相關推薦
評論