色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Google:將AI 應用到語言翻譯上,進而彌平語言不通的問題

yrlT_lianggezhi ? 2018-01-29 14:28 ? 次閱讀

Google 的使命是匯集全球資訊,并且讓所有人都能使用這些資訊,不過要能理解各式資訊,最困難的就是語言隔閡,因此在東京舉辦#MadeWithAI 亞太區媒體活動請來了Google 語言研究計畫總經理Linne Ha 來談談怎么將AI 應用到語言翻譯上,進而彌平語言不通的問題。

受惠于智慧型手機的普及,網路人口在最近這幾年高速成長,不過網路上有接近50% 的內容仍是以英文為主,對于非以英文為母語的人來說,想要獲得資料就多了一道門檻,能讓每個人自在的用自己的原生語言在網路上搜集或提供資料是Google 的目標,因此在推動語言翻譯或發展上Google 做了非常多的努力。

▲Google語言研究計畫總經理Linne Ha。

推動各種語言上網,統一碼(Unicode)是重點

不同語言要能在網路上流動,最重要的就是該語言要能被閱讀,若是出現亂碼或空白文字就容易成為閱讀或理解的障礙,因此Google 長期和統一碼(Unicode)聯盟合作,鼓勵更多國家利用統一碼的編碼系統上網,例如Google 大力鼓勵緬甸不要再使用非統一碼的字型。

有了統一碼這項文字系統后,電腦文字編碼就有了一套標準,下一個挑戰就是要確保自行能正確地被轉為網路或手機上的文字,去年Google 推出開放的Noto 字型,可以支援800 種語言、11 億個文字,可呈現各式各樣的文字。

但這樣還不夠,雖然文字能呈現,但卻不是每個人都知道如何輸入文字,因此除了Gboard 提供300 多種鍵盤、 97 種手寫系統、語音輸入等方法讓使用者可以依照自己方便的方式來輸入文字。

在開發手寫系統上,Google 也花了一番心力,由于每個人的字跡都不同,因此Google 導入人工智慧技術,搜集很多自愿者的手寫范本,讓機器學習來辨認文字和書寫風格,進而達到更精確的手寫辨識。語音輸入方面則是透過GOOG-411 的服務來搜集語音資料,類似我們的查號臺,當有人打電話進去問問題查電話,GOOG-411 就會幫忙轉接,在這樣的過程中Google 建立了大量的語音資料庫范本,英文語音搜集還算滿順利的。不過其他語言就沒這么容易了,雖然說Google 有和專門經營文字和語音資料庫的業者合作,但有些語言本身的資料庫就較少,例如廣東話,因此Google 又開啟了下一階段的任務。

語音搜尋實驗,搜集準確的語音資料

既然缺乏語音資料,Google 就開始想方法來搜集各種語言的語音訊息,比方說2010 年Google 推出了荷蘭語的Word of Mouth 計畫,提供參與實驗的使用者手機來搜集他們和親友間的對話樣本,進而得到準確的語音資料。

有了語音資料之后下個問題則是口音和俗語,關于這方面的資料目前Google 仍正在努力發展中,不過經過過去這么長一段時間的努力,到2012 年之后,語音搜尋已可支援到50 種語言,Google 也導入了深度神經網路提升語音辨識的準確性,今年則再新增30 多種的語音輸入,甚至包含了非洲兩種主要語言,斯瓦希里語(Swahili)和阿姆哈拉語(Amharic),對于彌平語言隔閡來說,這是一個重要的里程碑。

怎么將機器學習應用在語音服務上

既然有了機器學習這項技術,也就意味著Google 能透過演算以及建構更有效的模型來解決語音辨識問題。

Google 這回用了一個超級低成本的預算(2000 美金)來增加孟加拉語的文字轉語音服務,首先先準備一套麥克風、USB 轉接器和前置聲音放大器,并建立一組便攜式的錄音工作室「ChitChat」讓實驗者可以錄音。

工具有了,下一步就是找來15 名孟加拉的Googler,錄制了2000 多個從維基百科擷取出來的孟加拉語和英語,實驗者每隔30 分鐘至60 分鐘就錄制250 多個句子,平衡的混音成幾個不同的聲音后,再交給Google 社群投票看看大家最偏好哪一個聲音,最終產出的聲學模型剛好就可以代表平均型的人聲,成功推出了孟加拉語的文字轉語音服務。

除了把更多語言放到網路上,Google 也著手發展方言領域,像是英文就分成美式英文、英式英文、澳洲英文等等,最近Google 正著手處理新加坡式英語,另外,西班牙語、阿拉伯語也是Google 努力的方向。

Google 的中文語音什么時候會有更多突破?

至于***人最常用的中文呢?Google 語言研究計畫總經理Linne Ha 不諱言,中文真的是很有挑戰的語言,比方說中國人說著中文、寫著簡體中文,***人說也說著中文、但寫的是繁體中文,香港人寫的也是繁體中文、不過說的是廣東話,繁體中文、簡體中文、廣東話間各有連結但又不盡相似。

過去Google 是使用「單一語言模式」來處理,比方說***人說的中文就套用繁體中文資料庫,香港人說廣東話則套用另外一個繁體中文資料庫,但這樣的語音辨識效果發展有限,近期Google 嘗試著將相近的語言加進同一個模型中,目前的實驗結果還不錯。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Google
    +關注

    關注

    5

    文章

    1762

    瀏覽量

    57506
  • AI
    AI
    +關注

    關注

    87

    文章

    30736

    瀏覽量

    268896
  • 語言
    +關注

    關注

    1

    文章

    97

    瀏覽量

    24242

原文標題:【Google 談人工智慧】有了機器學習后,語言還會是隔閡嗎

文章出處:【微信號:lianggezhizi,微信公眾號:兩個質子】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI語言模型開發步驟

    開發一個高效、準確的大語言模型是一個復雜且多階段的過程,涉及數據收集與預處理、模型架構設計、訓練與優化、評估與調試等多個環節。接下來,AI部落小編為大家詳細闡述AI語言模型的開發步驟
    的頭像 發表于 12-19 11:29 ?56次閱讀

    LLMWorld上線代碼翻譯新工具——問丫·碼語翻譯俠,快來體驗!

    01. 工具介紹 aicode.llmworld.net 問丫·碼語翻譯俠 是一款由LLMWorld新推出的代碼翻譯工具,支持各種語言之間的翻譯,包括計算機
    的頭像 發表于 12-09 11:11 ?235次閱讀
    LLMWorld上線代碼<b class='flag-5'>翻譯</b>新工具——問丫·碼語<b class='flag-5'>翻譯</b>俠,快來體驗!

    語言模型開發框架是什么

    語言模型開發框架是指用于訓練、推理和部署大型語言模型的軟件工具和庫。下面,AI部落小編為您介紹大語言模型開發框架。
    的頭像 發表于 12-06 10:28 ?115次閱讀

    語言模型開發語言是什么

    在人工智能領域,大語言模型(Large Language Models, LLMs)背后,離不開高效的開發語言和工具的支持。下面,AI部落小編為您介紹大語言模型開發所依賴的主要編程
    的頭像 發表于 12-04 11:44 ?97次閱讀

    一文理解多模態大語言模型——

    /understanding-multimodal-llms 在過去幾個月中, OpenVINO? 架構師 Yury閱讀了眾多有關多模態大語言模型的論文和博客,在此基礎,推薦了一篇解讀多模態大語言模型的最佳文章《Underst
    的頭像 發表于 12-02 18:29 ?306次閱讀
    一文理解多模態大<b class='flag-5'>語言</b>模型——<b class='flag-5'>上</b>

    IMAX攜手Camb.AI實現影院實時語言翻譯

    近日,據外媒最新報道,國際知名影院品牌IMAX與總部位于迪拜的人工智能初創公司Camb.AI宣布達成戰略合作,旨在為全球影院觀眾帶來前所未有的實時語言翻譯體驗。 此次合作的核心目標是
    的頭像 發表于 11-26 13:55 ?381次閱讀

    在設備利用AI Edge Torch生成式API部署自定義大語言模型

    ,從而無縫地新的設備端生成式 AI 模型部署到邊緣設備。本文是 Google AI Edge 博客連載的第二篇。
    的頭像 發表于 11-14 10:23 ?421次閱讀
    在設備<b class='flag-5'>上</b>利用<b class='flag-5'>AI</b> Edge Torch生成式API部署自定義大<b class='flag-5'>語言</b>模型

    DeepL推出新一代翻譯編輯大型語言模型

    在人工智能與語言處理領域,DeepL再次以其創新實力引領潮流,宣布成功推出新一代面向翻譯與編輯應用的大型語言模型。這一里程碑式的進展,不僅鞏固了DeepL作為頂尖語言人工智能公司的地位
    的頭像 發表于 07-19 15:56 ?664次閱讀

    nlp自然語言處理的應用有哪些

    的應用。以下是一些NLP的主要應用領域,以及它們在各個領域的具體應用。 機器翻譯 機器翻譯是NLP的一個重要應用領域。它利用計算機自動一種語言的文本
    的頭像 發表于 07-05 09:55 ?2600次閱讀

    自然語言處理技術的原理的應用

    自然語言處理(Natural Language Processing, NLP)作為人工智能(AI)領域的一個重要分支,旨在使計算機能夠理解和處理人類自然語言。隨著互聯網的普及和大數據技術的發展
    的頭像 發表于 07-02 12:50 ?516次閱讀

    語言模型(LLM)快速理解

    歷史可以追溯到早期的語言模型和機器翻譯系統,但其真正的起點可以說是隨著深度學習技術的興起而開始。1.1統計語言模型在深度學習技術出現之前,語言模型主要基于傳統的統
    的頭像 發表于 06-04 08:27 ?961次閱讀
    大<b class='flag-5'>語言</b>模型(LLM)快速理解

    【大語言模型:原理與工程實踐】大語言模型的基礎技術

    就無法修改,因此難以靈活應用于下游文本的挖掘中。 詞嵌入表示:每個詞映射為一個低維稠密的實值向量。不同的是,基于預訓練的詞嵌入表示先在語料庫中利用某種語言模型進行預訓練,然后將其應用到下游任務中,詞
    發表于 05-05 12:17

    Stability AI發布Stable Code Instruct 3B大語言模型,可編譯多種編程語言

    據報道,Stability AI公司近期推出了適配程序員使用的Stable Code Instruct 3B大語言模型,此款模型的顯著特點是能夠實現編程語言間的自如切換。
    的頭像 發表于 03-27 10:04 ?490次閱讀

    【從0開始創建AWTK應用程序】編譯應用到RTOS平臺

    AWTK是基于C語言開發的跨平臺GUI框架。本系列文章介紹如何從0開始創建AWTK應用程序,包括搭建開發調試環境、使用AWTK創建Hello工程并在模擬器運行、AWTK應用程序移植到其它平臺。在
    的頭像 發表于 03-21 08:23 ?606次閱讀
    【從0開始創建AWTK應用程序】編譯<b class='flag-5'>應用到</b>RTOS平臺

    自然語言處理的研究內容

    模態 NLP:NLP 正在與計算機視覺融合,允許 AI 文本和圖像一起處理以獲得更豐富的理解。 3. 對話式AI:聊天機器人和虛擬助手正變得越來越對話,使人與AI的交互更加流暢和自然
    的頭像 發表于 01-18 16:39 ?431次閱讀
    主站蜘蛛池模板: 亚洲国产成人私人影院| ai换脸女明星被躁在线观看免费| 草莓AV福利网站导航| 久久国产免费观看精品1| 日韩亚洲欧美中文高清在线| 最近更新2019中文字幕免费| 国产欧美一区二区三区视频| 热思思| 在线A亚洲老鸭窝天堂AV高清| 国产精品麻豆高潮刺激A片| 高中生高潮抽搐喷出白浆视频 | 伊人亚洲AV久久无码精品| 久久精品无码人妻无码AV蜜臀| 诱人的女邻居9中文观看| 久久综合久久伊人| 91精品婷婷国产综合久久8| 免费无遮挡又黄又爽网站| TUBE19UP老师学生| 肉动漫3D卡通无修在线播放| 国产精品久久久久久久人热| 亚洲a免费| 精品午夜久久福利大片免费| 中文字AV字幕在线观看| 免费观看亚洲视频| 99热免费精品店| 日韩AV成人无码久久精品老人| 国产成人免费高清在线观看| 亚洲AV无码专区国产精品麻豆| 精品久久久久亚洲| 69国产精品成人无码视频| 妻子的秘密HD观看| 国产AV亚洲精品久久久久| 亚洲AV色香蕉一区二区三区| 久久国产精品久久国产精品| 99RE8国产这里只有精品| 日韩精品 电影一区 亚洲高清| 国产精品成人在线播放| 亚洲一二三产品区别在哪里| 伦理片天堂eeuss影院2o12| 超级最爽的乱淫片免费| 新妺妺窝人体色WWW|