看點:隨著語音交互走向爆發,一個新興行業、數十家芯片公司宣告語音芯片的崛起。
▲注以上為不完全統計
綜述:語音芯片發展三階段
本文所講的語音芯片側重于智能語音設備興起后,專門為語音交互場景打造的SoC芯片(芯片級系統,System on Chip),它兼具運算力和低功耗,支持多通道麥克風陣列接口,支持信號處理算法等。
通過對目前市面上語音芯片的觀察,我們發現語音芯片有以下特點:其一兼具運算能力和低功耗的考量,采用最適合做語音處理的CPU(中央處理器);其二是具備高度整合性的語音SoC,支持多通道的麥克風陣列接口,集成Codec(多媒體數字信號編解碼器)模塊/DSP(數字信號處理)模塊,并且集成WiFi/藍牙模塊等;其三在語音算法上支持回聲消除、噪聲抑制、聲源定位、語音增強等技術,或具備良好的音值調節功能;其四端智能化,集成神經網絡單元將部分云端訓練好的智能本地化工作。
通過小編近期對產業鏈的采訪以及梳理,根據語音交互的發展狀況,將語音芯片的發展歸納為三個階段,第一個階段為語音芯片過渡期,采用通用芯片組合方案;第二個階段為崛起期,語音芯片興起;第三個階段為語音芯片進化期,語音AI芯片涌現。
第一階段,大約2015年以前盡管智能語音設備,包括智能音箱、遠場交互的智能電視等都已出現,但在市場尚未起量的情況下,語音設備采用的多是通用芯片+Codec芯片/DSP芯片等相結合的方式實現語音處理,如全志的R16芯片。
2015年到2017年之間,隨著智能語音設備市場規模進一步發展,專門用于智能家居或智能音箱的語音芯片開始陸續亮相,包括聯發科推出的MT8516芯片、科勝訊的CX20924/CX20921、Amlogic的A113、瑞芯微的RK3036/RK3229等。
此外,隨著智能語音設備的迅速發展,對于端智能的需求也在顯現,語音AI芯片應運而生。端智能是近兩年來AI領域大火的概念之一,指的是數據的采集、計算、決策都在前端設備進行,優勢在于穩定、時延小、同時能夠保護用戶隱私等。如杭州國芯推出的GX8010和啟英泰倫推出的CI1006都屬于語音AI芯片。
前期:通用芯片組合搭配
在智能語音設備的市場早期階段,由于芯片研發漫長的周期(一般需要18~24個月),高昂的研發投入,因此在市場規模尚不大的情況下,市場并沒有專門的語音芯片應用到智能語音設備中。
▲德州儀器DM3725芯片
后來或許是處于成本以及其他考慮,亞馬遜的一些產品開始使用聯發科MT8563芯片,這款芯片同樣不是語音專用芯片。直到今年Q2季度,聯發科推出了MT8516才算真正意義上的語音芯片。
另外一個例子是國內早期智能音箱的代表叮咚音箱,最初國內也沒有專用語音芯片,采用的是全志科技R16芯片+科勝訊Codec芯片的方式進行語音處理,而全志R16之前則是用于平板的芯片。
在語音交互場景的早期,智能設備并無太多銷量,即使看到了這一潛在機會,研發一款專用芯片的時間成本、投資成本都決定了在最初一段時間,智能設備需要使用通用芯片或其他芯片作為過渡期。
中小語音芯片廠商涌現
隨著智能語音設備銷量不斷增長,典型的就是2016年以來,以亞馬遜Echo為代表的智能音箱市場規模的不斷擴大,專用的語音芯片也開始出現,2016年又剛好是語音芯片興起最集中的一年。
其實早在2013年7月國內首顆專用語音芯片就誕生了,它由四川長虹和中科院聲學所付強(現為先聲互聯創始人)團隊共同研發。新研發出的長虹語音芯片的優勢是在語音識別的基礎上,融合了多方面的語音增強功能,包括語音降噪、回聲消除、波束形成等,支持低功耗喚醒,能夠實現遠場語音采集。可能因為四川長虹的一些原因,這款芯片在研發出后并沒有投入生產,之后就不了了之。
2015年以后語音芯片就開始陸續興起,包括聯發科MT8516、科勝訊CX20924、晶晨半導體A113、瑞芯微RK3036、北京君正X1000等公司,如聯發科推出了MT8516應用在了阿里天貓精靈上,晶晨A113應用在了小米AI音箱上。
▲阿里天貓精靈主控板上使用的聯發科MT8516芯片
整體來說,這些語音芯片都是面向智能音箱以及智能家居場景打造的專用芯片,支持多通道麥克風陣列接口,采用適合做語音處理的CPU;在語音算法上支持回聲消除、噪聲抑制、聲源定位、語音增強等技術,并兼具運算能力和低功耗的考量。
目前無論是智能音箱還是其他智能設備,更多的智能都是在云端來實現,但云端存在著語音交互“時延”的問題,對網絡的需求限制了設備的使用空間,以及由此帶來的數據與隱私危機。為了讓設備使用場景不受局限,用戶體驗更好,端側智能以成為一種趨勢,語音AI芯片也隨之而來。
2016年以來,語音AI芯片也開始走進大家的視野。成都啟英泰倫在去年推出CI1006,杭州國芯在今年10月底推出GX8010,都是語音AI芯片。
▲杭州國芯GX8010芯片
對比語音芯片,語音AI芯片具備以下特點:首先語音AI芯片中集成了專用的AI處理器模塊,用以對本地的機器學習算法進行加速;其二高度集成,語音AI芯片不但集成CPU、AI處理器,還會將DSP信號處理、WiFi/藍牙等模塊集成進去;其三能夠實現端側智能,將一些常用或者簡單的功能直接集成到本地,通過AI芯片進行本地計算,從而設備可以在端側離線完成如聽音樂、日常問答及閑聊等任務,實現更快的交互能力。
再考慮到用戶體驗以及數據隱私等問題,更快的交互體驗以及更多本地計算會是一種趨勢,隨著智能語音場景的爆發, 語音AI芯片也會迅速發展。
但目前的AI芯片更多的在于手機和視覺應用領域,一方面手機市場體量足夠龐大,另一方面視覺應用技術也相對成熟。而在語音領域,一方面語義理解技術短期內很難突破,另外智能語音是一個新興市場,智能音箱作為典型爆款產品,今年全球整體市場規模也不過2500萬~3000萬臺之間,而這些都導致了語音AI芯片進展相對緩慢。
聯發科副總經理暨家庭娛樂產品事業群總經理游人杰曾對智能語音的發展提出一個三階段論的觀點,他認為智能語音的第一階段是智能音箱的普及,第二階段是更多智能語音設備的出現,語音成為人機交互的界面,第三階段就是端側智能,通過語音AI芯片來實現更多本地計算,提供用戶更好的交互體驗。
不難看出,我們目前還處于第一階段,需要推動智能音箱的普及以及更多智能設備的出現,從而推動語音交互界面的到來。只有當語音成為一種交互界面,才意味著整個智能語音市場的爆發,才會有更多的巨頭芯片廠商以及中小芯片商涌入其中。
而針對當下智能語音設備所需的智能化,游人杰談到,CPU本身可以做一些“輕”AI的功能,如果本地需要很強的AI能力,目前則會在語音芯片的基礎上外置一個AI處理器來實現。此外游人杰也透露,聯發科語音AI芯片的推出尚需1~2年時間。
相比一款新型芯片研發的高昂成本,在對算力有很大需求的產品上,通過添加一個獨立的AI處理器模塊,確實可以快速滿足產品端對AI能力的需求,并且緩解了芯片產品漫長的研發周期(一般18~24個月)。從時間來看,隨著智能語音的興起,未來1~2年后可能將會是語音芯片爆發的高峰期。
語音芯片帶動新興行業
有分析認為,到2020年AI芯片市場規模將達到146.16億美元,約占全球人工智能市場規模12.18%。隨著人工智能的火熱,以GPU(圖形處理器) 、FPGA(現場可編程門陣列) 、ASIC(為專門目的而設計的集成電路)為代表的AI芯片類別均將獲得快速發展,語音芯片/語音AI芯片也會在這個過程中受益并爆發,在此過程中會誕生一個新興的語音芯片行業,以及一波語音芯片公司。
根據游人杰智能語音發展的三階段論,目前我們還處于第一階段的智能音箱普及期,先通過一款爆款產品來引爆整個語音交互行業,并由此推動家庭場景、辦公場景等的語音智能化,使語音成為人機交互的一個界面,才能真正推動語音芯片的爆發,以及演進到語音AI芯片。
僅僅是今年全球智能音箱市場銷量預計有望達到3000萬臺,隨著語音交互進一步爆發,場景進一步開拓,智能語音設備將快速進入億級規模市場,可見無論是當下的語音芯片還是即將到來的語音AI芯片,都將有廣闊的市場空間。
由于當下智能語音市場規模相對較小,相比芯片研發的高成本投入,像高通、英偉達、英特爾等芯片巨頭或是并不看好這塊市場或是語音芯片研發進展緩慢,給予了更多中小芯片廠商發展的機會。
目前在語音芯片行業已涌現出數十家公司在這一領域“開疆擴土”,包括聯發科、杭州國芯、全志科技、晶晨半導體、啟英泰倫等,既有芯片領域的大公司,面向智能家居、消費電子領域的國有芯片品牌,還有新興的創業公司。正是語音交互的興起,為他們在既有業務之外,提供了一個新的經濟增長點,并且隨著語音交互的爆發,這一領域甚至會誕生下一個巨頭芯片公司。
可以預見的是,2018年會有更多語音芯片的誕生,在未來1~2年,語音AI芯片也將進一步發展迎來爆發期。
結語:語音芯片的崛起
隨著語音交互設備的誕生發展,芯片也經歷著從通用組合芯片到語音芯片再到語音AI芯片的演進。隨著語音交互的爆發,語音真正成為人機交互的界面,語音芯片也將成爆發之態。
但與此同時,語音與視覺也將會走向融合,畢竟多元的交互方式才更符合人性的體驗。在語音芯片崛起后,“語音+屏幕”相結合的交互方式也是業界更加認可的一種趨勢。
-
語音芯片
+關注
關注
12文章
1749瀏覽量
36461
原文標題:千萬銷量百億市場 語音芯片崛起!
文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論