Mozilla 宣布它正在使其眾包項(xiàng)目 Common Voice 支持更多語言。Common Voice 是一個(gè)旨在創(chuàng)建開源語音識(shí)別數(shù)據(jù)集的項(xiàng)目,于去年6月發(fā)布,它邀請(qǐng)來自世界各地的志愿者通過網(wǎng)絡(luò)和移動(dòng)應(yīng)用程序,用他們的聲音記錄文本片段。
業(yè)內(nèi)普遍認(rèn)為語音將成為下一個(gè)重要的技術(shù)平臺(tái),近年來隨著人工智能理論與技術(shù)的迅猛發(fā)展,語音識(shí)別技術(shù)在不斷突破,通過語音助手如 Alexa、Google Assistant、Siri 和 Cortana,各公司將收集到的用戶語音數(shù)據(jù)歸為公司自己所有,這些數(shù)據(jù)的價(jià)值或許目前很難被外界看出來,但是在信息化高度發(fā)達(dá),特別是今天這樣一個(gè)大數(shù)據(jù)和人工智能時(shí)代,為開發(fā)機(jī)器學(xué)習(xí)模型提供語音數(shù)據(jù)集怎么看都是一件有深遠(yuǎn)意義的事,這些語音數(shù)據(jù)的意義會(huì)慢慢體現(xiàn)。
而最終當(dāng)它們的價(jià)值逐漸顯現(xiàn),人們會(huì)發(fā)現(xiàn)在這背后亞馬遜、谷歌、蘋果和微軟等公司已經(jīng)牢牢鎖住了語音技術(shù)的命門,主導(dǎo)了這場(chǎng)語音市場(chǎng)之爭(zhēng)。
Common Voice 項(xiàng)目就是為了避免這樣的事情而誕生的,它的目的是將收集到的語音數(shù)據(jù)集開源給公眾,使得任何人都可以自由使用這些數(shù)據(jù)集來將語音識(shí)別技術(shù)智能地構(gòu)建到各種應(yīng)用程序和服務(wù)中。Mozilla 已經(jīng)在去年11月公布了 Common Voice 英語數(shù)據(jù)集的第一批成果,其中收錄了20000個(gè)人錄制的40萬個(gè)錄音、大約500小時(shí)的演講。此次 Mozilla 又宣布它正式開始收集法語、德語和威爾士語三種語言的語音數(shù)據(jù),同時(shí)也在為收集另外40種語言做準(zhǔn)備,巴西葡萄牙語、印度尼西亞語、波蘭語和荷蘭語等已經(jīng)準(zhǔn)備好啟動(dòng)眾包語音數(shù)據(jù)收集。
Mozilla 首席創(chuàng)新官 Katharina Borchert 在他的博客中寫到:“我們希望用戶使用自己的語言甚至方言的時(shí)候是可以被機(jī)器理解的,但是我們相信這些技術(shù)上的接口不應(yīng)該由少數(shù)幾家公司控制,他們不能像守門員一樣來完全把控語音服務(wù)。”
Common Voice 項(xiàng)目的意義與用于打擊私人平臺(tái)的開放許可證項(xiàng)目類似,OpenStreetMap 就是一個(gè)很好的例子。OpenStreetMap 為開發(fā)者提供了開放且可自由使用的世界地圖,使得開發(fā)商不再需要依賴于 Google Maps 這樣的競(jìng)爭(zhēng)對(duì)手,不僅降低了成本開銷,技術(shù)上也不再受到限制。
“使用多種語言標(biāo)志著 Common Voice 邁出了重要的一步,我們希望它對(duì)整體語音技術(shù)來說也是一大步”,Mozilla Common Voice 項(xiàng)目的數(shù)字策略師 Michael Henretty 補(bǔ)充到:“語音技術(shù)的民主化不僅會(huì)降低全球創(chuàng)新的障礙,也會(huì)讓人們獲取信息更加便捷。”
-
Mozilla
+關(guān)注
關(guān)注
0文章
50瀏覽量
11234 -
語音識(shí)別
+關(guān)注
關(guān)注
38文章
1742瀏覽量
112717
原文標(biāo)題:打破語音壟斷 Mozilla Common Voice 支持更多語言
文章出處:【微信號(hào):robot-1hjqr,微信公眾號(hào):1號(hào)機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論