谷歌正在開發(fā)各種人工智能技術(shù),其中包括一個(gè)通用語音模型,這是該公司試圖建立一個(gè)可以理解世界上1000種最常用語言的模型的一部分。
有傳言稱,除了計(jì)劃在今年的年度 I/O 活動(dòng)中展示20多款人工智能產(chǎn)品外,谷歌正在朝著構(gòu)建支持1,000種不同語言的人工智能語言模型的目標(biāo)邁進(jìn)。在周一發(fā)布的更新中,谷歌分享了有關(guān)通用語音模型 (USM) 的更多信息,該系統(tǒng)被谷歌描述為實(shí)現(xiàn)其目標(biāo)的“關(guān)鍵的第一步”。
去年11月,該公司宣布計(jì)劃創(chuàng)建一個(gè)支持1,000種世界上使用最廣泛的語言的語言模型,同時(shí)還展示其 USM 模型。谷歌將 USM 描述為“最先進(jìn)的語音模型家族”,有20億個(gè)參數(shù),經(jīng)過1200萬小時(shí)的語音和280億個(gè)句子的訓(xùn)練,涵蓋300多種語言。
USM 已被 YouTube 用于生成隱藏式字幕,它還支持自動(dòng)語音識(shí)別 (ASR),支持自動(dòng)檢測和翻譯語言,包括英語、普通話、阿姆哈拉語等。
目前,谷歌表示 USM 支持100多種語言,并將作為構(gòu)建更廣泛系統(tǒng)的“基礎(chǔ)”。另外,Meta 也正在開發(fā)一種類似的 AI 翻譯工具,該工具仍處于早期階段。
審核編輯黃宇
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
相關(guān)推薦
開發(fā)一個(gè)高效、準(zhǔn)確的大語言模型是一個(gè)復(fù)雜且多階段的過程,涉及數(shù)據(jù)收集與預(yù)處理、模型架構(gòu)設(shè)計(jì)、訓(xùn)練與優(yōu)化、評(píng)估與調(diào)試等多個(gè)環(huán)節(jié)。接下來,AI部
發(fā)表于 12-19 11:29
?51次閱讀
大語言模型開發(fā)框架是指用于訓(xùn)練、推理和部署大型語言模型的軟件工具和庫。下面,AI部落小編為您介紹
發(fā)表于 12-06 10:28
?115次閱讀
在人工智能領(lǐng)域,大語言模型(Large Language Models, LLMs)背后,離不開高效的開發(fā)語言和工具的支持。下面,AI部落小
發(fā)表于 12-04 11:44
?95次閱讀
/understanding-multimodal-llms ? 《一文理解多模態(tài)大語言模型 - 上》介紹了什么是多模態(tài)大語言
發(fā)表于 12-03 15:18
?113次閱讀
云端語言模型的開發(fā)是一個(gè)復(fù)雜而系統(tǒng)的過程,涉及數(shù)據(jù)準(zhǔn)備、模型選擇、訓(xùn)練優(yōu)化、部署應(yīng)用等多個(gè)環(huán)節(jié)。下面,AI部落小編為您分享云端
發(fā)表于 12-02 10:48
?110次閱讀
大語言模型的開發(fā)是一個(gè)復(fù)雜且細(xì)致的過程,涵蓋了數(shù)據(jù)準(zhǔn)備、模型架構(gòu)設(shè)計(jì)、訓(xùn)練、微調(diào)和部署等多個(gè)階段。以下是對(duì)大語言
發(fā)表于 11-04 10:14
?135次閱讀
的表達(dá)方式和生成能力。通過預(yù)測文本中缺失的部分或下一個(gè)詞,模型逐漸掌握語言的規(guī)律和特征。
常用的模型結(jié)構(gòu)
Transformer架構(gòu):大語言
發(fā)表于 08-02 11:03
的機(jī)會(huì)!
本人曾經(jīng)也參與過語音識(shí)別產(chǎn)品的開發(fā),包括在線和離線識(shí)別,但僅是應(yīng)用語言模型實(shí)現(xiàn)端側(cè)的應(yīng)用開發(fā),相當(dāng)于調(diào)用模型的接口函數(shù),實(shí)際對(duì)
發(fā)表于 07-21 13:35
、速度慢、費(fèi)用高且難以準(zhǔn)確理解上下文”的問題。相比之下,AI大模型憑借其強(qiáng)大的學(xué)習(xí)能力和適應(yīng)性,在翻譯質(zhì)量、效率、上下文理解和多
發(fā)表于 07-14 08:04
?128次閱讀
在人工智能領(lǐng)域,大語言模型一直是研究的熱點(diǎn)。近日,全球科技巨頭谷歌宣布,面向全球研究人員和開發(fā)人員,正式發(fā)布了其最新研發(fā)的大
發(fā)表于 06-29 09:48
?433次閱讀
自2022年,ChatGPT發(fā)布之后,大語言模型(LargeLanguageModel),簡稱LLM掀起了一波狂潮。作為學(xué)習(xí)理解LLM的開始,先來整體理解一下大
發(fā)表于 06-04 08:27
?961次閱讀
的工具。通過這一框架,研究人員和使用者可以更準(zhǔn)確地了解模型在實(shí)際應(yīng)用中的表現(xiàn),為后續(xù)的優(yōu)化和產(chǎn)品化提供有力支持。針對(duì)語言理解類評(píng)測任務(wù),特別是古文及諺語理解,我們深入評(píng)估
發(fā)表于 05-07 17:12
的特征,并且這些特征融合了這些詞在當(dāng)前序列的上下文語義,因此能夠解決一詞多義的問題。憑借這種優(yōu)勢(shì),基于動(dòng)態(tài)詞向量語言模型進(jìn)行預(yù)訓(xùn)練的方法被廣泛應(yīng)用于自然
發(fā)表于 05-05 12:17
。這一過程的不斷迭代使大語言模型的語言理解和生成能力逐步提升。大語言模型在自然
發(fā)表于 05-04 23:55
谷歌模型軟件通常指的是谷歌推出的一系列人工智能模型和軟件工具,其中最具代表性的是Google Gemini。Google Gemini是谷歌
發(fā)表于 03-01 16:20
?650次閱讀
評(píng)論