在阿里巴巴以天貓精靈的智能音箱為核心載體,大舉進軍智能家居市場的形勢下,也許帶給業界的有兩點思考:智能家居正在被巨頭帶熱,智能語音在智能家居的重要性突顯。
智能語音分為離線語音、在線語音以及離線+在線三種。電子發燒友網記者從最近的行業走訪來看,離線語音的智能家居方案正在興起,并在智能家居的單品和全屋智能中大力出貨。
提升智能單品、智能家居的智能化和體驗
智能語音晾衣架是一個比較火爆的單品,智能語音晾衣架品牌主要有好太太、晾霸、曬霸、邦先生等等。電子發燒友網記者從渠道了解到,晾衣架企業正在將部分傳統晾衣架產品逐漸轉向智能語音,以提升產品的價值和智能使用體驗。
中國建筑裝飾裝修材料協會晾衣架專委會數據顯示,2017 年我國電動(智能)晾衣架出貨量約為 350 萬臺,連續兩年增速接近 100%,增長迅速,預計未來隨著用戶認知度提升,智能晾衣架滲透率也有望快速提升。
在采訪中,電子發燒友記者看到智品惠推出的一款離線語音淋浴屏,在流水聲等嘈雜環境下仍能夠控制自如,還可用方言進行編輯。智品惠科技總經理李希途表示,離線語音已經成為家居市場的一個新選擇,以其更快速的響應、更親民的價格,新穎的產品形態滿足市場的需求。
實際上,全屋智能的控制類產品都是離線語音的主戰場。阿凡達智控總經理馮惠軍博士在接受電子發燒友網采訪時表示,離線主打控制,在線主打交互,是目前智能家居落地比較親民的一種模式,從市場端他們也感受到這股熱潮。
阿凡達的離線語音方案可控制家居的照明、空調、電視、窗簾等物品的開關,其控制時間最短僅需0.2秒,相較在線語音的體驗,交互效率大大提升。這個離線語音模塊能夠以智能音箱的形式獨立存在,成為家居的中控,也可以安裝在例如臺燈、吸頂燈等家居用品上,十分方便。
阿凡達提供了一套離線語音全屋智控生態系統,涵蓋以小寶精靈為中心,通過匹配紅外家電遙控器實現傳統家電的聲控,通過配套RF智能單火開關面板、RF隨意貼無線開關、RF智能插座、RF通斷器、RF開合窗簾等功能拓展設備,實現了照明、家電、遮陽管理、電源管理等由離線語音打造的全屋智能生態。
不同于在線語音交互對云端的依賴,離線語音技術可以讓設備本身具有交互能力。優勢是無需網絡,無需APP,無需布線,插電即用,本地識別,輕松喚醒,反應靈敏,后續維護服務少等。馮博士認為,離線語音的特性滿足了用戶對家居控制的基本需求,成本低易于推廣,這個市場處于爆發的前期。
從渠道反饋來看,以單品看,目前離線語音控制空調的智能插座出貨量比較大。智能家居、酒店、民宿等市場對離線語音的需求正在放量。
離線語音方案有哪些?
前不久,Google推出了Google Local Home SDK,通過邊緣計算在本地進行語音識別,不用在云端處理。電子發燒友網記者了解到,目前可實現離線語音方案的芯片包括啟英泰倫、國芯、思必馳、互問、新唐、君正等等。
啟英泰倫:人工智能語音芯片CI1006和最新CI110X系列
2016 年 9 月推出了全球首款人工智能語音識別芯片 CI1006,并于 2017 年 1 月實現量產。這是全球首款 DNN 處理器內核人工智能語音芯片,具備高 NN 算力、高識別率、遠距識別、快速響應、超低功耗等特性。
2019年9月發布第二代語音 AI 芯片 CI110X 系列集成了更豐富的功能、擁有更強大的性能、同時具備更低的成本和功耗。
CI110X 系列基于 NPU+MCU 架構設計,內置升級了的腦神經網絡處理器 BNPU v2,并新增了語音加速傳感器。CPU 主頻也較上一代的 100 MHz 提升到了 160MHz。
同時,CI110X 系列還內置高性能低功耗 Audio Codec 模塊和硬件音頻處理模塊,可以外接麥克風實現單芯片遠場降噪和回聲消除等功能。同時該芯片還集成多路 UART、I2C、SPI、PWM、GPIO 等外圍控制接口,可以開發低成本的單芯片智能語音離線識別方案。
而通過內置的高速 UART 或 SDIO 接口對接 Wi-Fi、藍牙等無線模塊,實現離在線語音方案。基于 CI110X 系列芯片開發的產品,語音交互的基本功能可通過離線語音實現,而語音內容和服務則可以通過聯網實現。
杭州國芯:GX8008和GX8009芯片
GX8008芯片是專為智能語音前端信號處理而設計的嵌入式SoC芯片,支持麥克風陣列,集成專用于語音信號處理的DSP處理器,內置處理前端信號的語音算法,可以讓傳統的設備保留其原先硬件的基礎上,通過一個簡單的USB口實現語音能力的升級。獨特的待機模式,可以讓主機完全休眠,只用GX8008芯片來做降噪和激活,并恢復系統。
GX8009芯片是專為AI語音應用設計的嵌入式SoC芯片,擁有獨特的多核異構架構,集成自主產權的NPU神經網絡處理器,用于語音信號處理的DSP處理器等模塊,使得產品能處理深度神經網絡計算,離線運行麥克風陣列信號。GX8009芯片針對語音應用產品進行深度優化,可運用于多種形態的AI語音產品。
思必馳:深聰TAIHANG芯片(TH1520)
TH1520主要面向智能家居、智能終端、車載、手機、可穿戴設備等各類終端設備。解決方案包含算法+芯片,具有完整語音交互功能,能實現語音處理、語音識別、語音播報等功能,支持離線語音交互。
君正:Halley2 IoT模組
采用君正 X1000E 處理器,最高1GHz主頻,支持硬件浮點,支持SIMD指令加速??蛇\行各類語音識別、圖像識別、降噪、消回音、APE/FLAC解碼等算法。待機功耗2mW,平均運行功耗200mW,最高運行功耗700mW。支持WiFi、藍牙、以太網、LCD顯示、錄音、放音、攝像頭、SD卡、USB 2.0 OTG、I2C、UART等。超小模塊,鍍金半孔PCB板,可直接量產,大大降低產品開發難度,縮短產品上市時間。硬件設計和軟件Linux SDK開源,便于客戶進行二次開發。
互問:LS416、W02x
LS416 是一顆高度集成化的語音處理芯片,內置互問離線語音識別引擎,支持多命令詞本地語音控制應用。 內置spi flash 和高性能codec,使用低成本輕量化神經網絡語音處理單元,以及低功耗MCU,支持多種邏輯應用開發。
互問W02x芯片 是一款高度集成的本地語音系統級芯片(SoC),自研基于神經網絡深度學習的本地喚醒和前端降噪算法,無需額外license。支持多級喚醒和多個本地固定詞命令詞,支持多通道/多麥克回聲消除功能,可作為AEC前端處理+本地喚醒,支持I2S作為super codec使用。內置深度定制的神經網絡處理單元、邏輯控制單元,無需MCU處理簡單邏輯。
新唐ISD9xxx系列:
此方案提供簡單指令辨識與喇叭獨立語音識別,并可由用戶訓練聽從指令,一旦辨識出指令,裝置就能在預先儲存在芯片上的閃存中的音頻提供音效。目前支持 9 種語言及多種方言。
在音訊功能部份,ISD9xxx系列包括一顆具備80dB SNR效能的Sigma-Delta ADC,搭配具有最高至56dB增益的可程式增益放大器(PGA),以直接連接麥克風。音訊輸出是由能對8?喇叭輸出1W功率的差動Class D放大器 (DPWM)所提供的。
ISD9160VI能提供對于少數字節的簡單指令,例如開燈、關燈、退出、播放等語音辨識,一旦辨識出指令(關鍵字),裝置就能在預先儲存在芯片上的快閃記憶體中的音訊提供音效。
根據Strategy Analytics最新發布的研究報告顯示,2019年,消費者在智能家居相關硬件、服務和安裝費用上的支出將達到1030億美元,預計到2023年將增長至1570億美元。到2023年,21%將擁有遠程監控和控制,設備支出將占智能家居設備總支出的52%。未來,離線語音以及離線加在線語音等多種語音形式,將更加廣泛地應用于智能家居、智能辦公等多種場景。
發布評論請先 登錄
相關推薦
評論