美國研究公司Strategy Analytics近日發布了《2018年第三季度全球智能音箱市場報告》。報告顯示,全球智能音箱出貨量第三季度達到2270萬,同比增長197%,創歷史新高。亞馬遜在第三季度依然市場占有率最高,占據了32%的份額,谷歌以23%的份額緊追其后。百度的加入改變了全球智能音箱的市場格局,市場占有率猛增至8%,進入全球前四名。
“據IDC統計,2018年第三季度,搭載百度DuerOS的智能音箱在中國市場出貨量第一名,小度系列智能硬件在中國市場增速最快,市場份額增至24%。百度在遠場語音技術上有很大的突破。我們和Duer OS生態一起發展,上周Duer OS產品的出貨量突破2億。這與百度遠場語音技術的突破是密切相關的。“百度語音部門負責人在1月16日深圳舉辦的百度大腦硬件及平臺發布會現場表示。
遠場語音技術三大關鍵點
2017年年初,各家開發廠商針對遠場語音技術進行軍備競賽,智能音箱的市場大戰,從2017年開始到現在,是從近場語音技術到遠場語音技術的過度階段,廠商會介紹自己的遠場語音技術多么厲害,現在很少有人提手機上語音識別的效果。
遠場語音技術的三大關鍵點:第一、信號處理,沒有信號處理,就沒有現在的遠場語音的效果,信號處理用于定位,定位算法才能創造遠場語音智能;第二、軟硬結合,在遠場交互時代,需要與硬度深度結合,將算法、軟件在硬件上打磨好,提升用戶體驗;第三、端到端語音語言一體化,信號處理基于端到端建模,聲學模型是匹配好場景的,還有喚醒技術,采用端到端思路,對端到端詞匯進行建模,再將喚醒技術和信號處理技術結合,下沉到Duer OS系統層,才能達到很好的喚醒效果。
語音技術軟硬一體化解決方案
教會機器聽懂人話的過程,就是通過深度神經網絡訓練聲學模型和語言模型的過程。而一些公司宣傳的機器識別準確率過高,速記員都達不到這一水平,還有很多相關的工作需要去完成,不能單靠深度神經網絡的方法來實現。語音識別準確率涉及多方面原因,例如遠場精確識別就是業界難題。
“最新一年百度在語音技術上兩大進展:一次喚醒多次交互技術,技術特點是信號尾點和語義尾點聯合優化模型;第二點,針對聲學模型和語義模型做雙重的置信度模型,在喚醒一次后可以和機器進行自由交談,技術的關鍵點是將干擾信息去除。需要端到端的思路,用信號衰減的思路,配合聲紋技術,進行交互。這個技術會在小度系列的硬件產品落地。” 百度語音部門負責人解釋說。
百度在遠場語音交互技術突破,包括一次喚醒多次交互技術以及 SMLTA 模型,SMLTA 模型在百度輸入法正式發布這個技術,特點是語言和語義進行建模訓練,這個模型可以跑在手機端,取得和在線識別媲美的效果。
百度歷經一年多的打磨和開發,全新推出了百度遠場語音開發套件,包括遠場語音端到端技術、兩款分別主打高性能和高性價比的計算板卡、3種形態的麥克風陣列,形成了環形6+1麥、線形4麥和車載3麥的多形態麥克風陣列套件方案。
“讓硬件制造商、ODM、OEM做智能音箱、智能電視、語音機器人、可穿戴設備和車載可以在百度大腦上找到和使用語音開發套件。我們希望提供一條產業鏈,讓上下游合作起來。” 百度語音部門負責人強調說。“這套開發套件的優勢,靈活、快速讓開發者對接自己在場景中的資源,對接語義理解能力,對接知識庫。“
百度遠場語音開發套件基于端到端方案,嚴格按照最佳技術實踐指導生產,可解決語音交互產品研發過程中無可用設備選型、選型調試成本大、調試效果不佳等問題。該方案支持回聲消除、聲源定位、波束形成、噪聲抑制等處理算法,一、三、五米識別和喚醒效果優于同類產品,目前已落地150多款產品。
車載三麥克陣列,車上語音識別要求比較高,不僅是主音區,而且是雙音區的語音識別,除了主駕駛位,還包括副駕駛位,百度車載三麥克鈍角陣列放置在車頂,可以輕松實現主音區和雙音區的語音識別,解決方案已經在百度車聯網聯盟內的被多個車廠采用。百度還在做DSP相關技術,配合麥克風陣列,價格更有競爭力。
主流芯片價格透明,兩年原廠開發經驗,主板方案非常有競爭力。合作模式:語音端到端產品,開發時間長,需要重新開模和設計,直接貼牌,提供產品原型,在這個基礎上做二次開發;線下做開發,把方案放入適用的產品內部。
百度大腦AI硬件生態聯盟
發布會現場,百度聯合首批合作伙伴成立百度大腦硬件生態聯盟,首批聯盟伙伴包含芯片廠商賽靈思,攝像頭模組廠商奧比中光、睿識、慧谷航天,開發套件廠商天啟,終端設備廠商華正聯等等。作為聯盟發起人和組織者,百度大腦希望與聯盟伙伴一起,共同制訂端計算與AI硬件標準,共同促進和繁榮AI落地應用。
百度大腦也將對聯盟合作伙伴提供深度技術支持、渠道支持、品牌授權、產品折扣和運營資源等權益,全面開啟AI技術終端化的大門,賦能合作伙伴的同時為產業帶來加速的交流和融合。正如百度AI技術生態部總經理喻友平所言,人工智能若要長期推動各個產業的升級與優化,需要合作伙伴的共同努力,打造適合AI發展的健康環境。
-
百度
+關注
關注
9文章
2268瀏覽量
90363 -
語音識別
+關注
關注
38文章
1739瀏覽量
112635 -
智能音箱
+關注
關注
31文章
1783瀏覽量
78567
發布評論請先 登錄
相關推薦
評論