谷歌正在開發各種人工智能技術,其中包括一個通用語音模型,這是該公司試圖建立一個可以理解世界上1000種最常用語言的模型的一部分。
有傳言稱,除了計劃在今年的年度 I/O 活動中展示20多款人工智能產品外,谷歌正在朝著構建支持1,000種不同語言的人工智能語言模型的目標邁進。在周一發布的更新中,谷歌分享了有關通用語音模型 (USM) 的更多信息,該系統被谷歌描述為實現其目標的“關鍵的第一步”。
去年11月,該公司宣布計劃創建一個支持1,000種世界上使用最廣泛的語言的語言模型,同時還展示其 USM 模型。谷歌將 USM 描述為“最先進的語音模型家族”,有20億個參數,經過1200萬小時的語音和280億個句子的訓練,涵蓋300多種語言。
USM 已被 YouTube 用于生成隱藏式字幕,它還支持自動語音識別 (ASR),支持自動檢測和翻譯語言,包括英語、普通話、阿姆哈拉語等。
目前,谷歌表示 USM 支持100多種語言,并將作為構建更廣泛系統的“基礎”。另外,Meta 也正在開發一種類似的 AI 翻譯工具,該工具仍處于早期階段。
審核編輯黃宇
-
谷歌
+關注
關注
27文章
6215瀏覽量
106694 -
AI
+關注
關注
87文章
32894瀏覽量
272379 -
USM
+關注
關注
0文章
7瀏覽量
7272
發布評論請先 登錄
相關推薦
《AI Agent 應用與項目實戰》----- 學習如何開發視頻應用
AI大語言模型開發步驟
大語言模型開發語言是什么
【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習
【《大語言模型應用指南》閱讀體驗】+ 俯瞰全書
超ChatGPT-4o,國產大模型竟然更懂翻譯,8款大模型深度測評|AI 橫評

評論