隨著人工智能和物聯網技術的發展,AI技術紛紛進行著商業化落地并快速升級。AI語音作為人機交互的主要方式之一備受關注,預計2019年中國智能語音市場規模將進一步增長,達到200億元。
7月19日,由深圳灣主辦的 WARE 2019第Ⅱ季 新硬件AI技術與應用峰會在深圳舉行,該峰會匯聚了AI語音行業的各位大咖,共話AI語音的前沿技術、落地應用及未來演變趨勢。
現場,思必馳CMO龍夢竹以”無微不至,智能小家電的AI攻勢“為題進行了分享。
圖:思必馳CMO龍夢竹
她表示,消費市場靠智能音箱打響了第一槍,目前全行業全品類也在逐漸+AI,硬件、服務、交互體驗均在升級,去中心化趨勢明顯。
思必馳作為全鏈路語音技術方案的提供商,面對日漸發展的藍海市場,感受到了技術需求的明顯變化。例如,算法和算力作為原動力,推動著AI滾滾前行,5G時代的到來給予了人工智能更強大的計算空間,但是對于臺燈、插座、耳機等以極簡化的命令式交互為主的終端來講,更輕快的能效體驗成為需求。
一直以來,超高度的定制化是IOT類產品企業的強需求,就此思必馳做深做透,結合個性化定制的需求,推出DUI開放平臺,用戶在語音技術、應用場景、對話邏輯、技能知識等方面均可自行定制,增強產品的個性化特征。
在這一過程中,對于智能小家電、智能穿戴類企業而言,除定制需求外,在特定場景下的功能、功耗、能效、響應速度等方面均有不同需求。龍夢竹表示,通過實際對接過程中反哺技術的更新,我們發現了一些“深藏不露”的技術熱點。
全雙工,進一步推進人機對話的演變。
從單輪對話到多輪對話,全雙工技術進一步推進人機對話的演變,使其具備實時智能響應、智能打斷、智能糾錯、多輪交互等能力,源源不斷的語音上行流和源源不斷的下行流,支持機器聽+說同時進行,具備智能決策的能力,能夠判斷噪音、指令、響應時間、響應信號等,并可通過語義分析判斷語氣詞、無效詞、可忽略的停頓等,具備一次喚醒、多次交互的能力。
龍夢竹表示,全雙工語音技術的成熟應用讓機器智能對話變得更流暢。但是,全雙工尚未成熟到通用階段,但在部分應用場景中已初見成效,例如在智能客服場景,以及命令式交互為主的智能設備,比如臺燈、耳機、空調等,比如“你好小馳,空調開到,嗯,20度,不不不,25度吧。”。
分布式麥克風陣列方案的需求浮出水面。
當前,麥克風陣列技術在智能音箱市場中的應用已十分普遍,遠場交互、聲源定位、算法降噪等技術均優化了產品體驗,例如,思必馳雙麥、線性/環形4麥、線性/環形6麥等多款軟硬一體化方案的市場應用已十分成熟。
但是,隨著多品類智能終端產品在用戶生活中涌現,“一呼百應”的情況常常發生,此時,對分布式麥克風陣列解決方案的需求便浮出水面。
分布式麥克風陣列可讓多個非結構排列的無規則麥克風組成陣列系統,提供就近喚醒功能,相對于規則化的麥陣,功耗更低。同時,借助聲紋識別技術,判斷說話人身份,避免設備長時間處于工作狀態,達到低功耗目的。
全屋智能,多設備聯動喚醒機制十分必要。
例如,正面喚醒可以通過近距離交互方式,面對面地喚醒設備以避免多設備誤喚醒;就近喚醒則利用聲波到達設備的時間差,對同一喚醒詞的多款設備進行空間計算,利用二級喚醒機制來喚醒距離用戶最近的設備;語義選擇會基于one-shot云+端混合識別技術,實現本地喚醒詞和云端識別語義一體化,基于用戶語義分析用戶意圖,以喚醒相應設備;多模態交互技術帶來了多模態直視喚醒,模擬人與人眼神交互的特點,喚醒用戶需要交互的設備。
這些深藏不露的技術熱點,讓語音交互在IOT中的應用更加流暢自然。
同時,面對智能小家電、智能穿戴產品對低功耗的需求,思必馳推出低功耗算法方案,能夠讓設備持續工作、隨叫隨到,讓更多的小設備快速+AI。
思必馳低功耗算法方案將根據硬件結構評審和聲學評估結果,結合產品應用場景,提供相應的單項/組合項算法方案,主要可分為一級低功耗喚醒,二級喚醒驗證,三級聲紋驗證。
尤其是一級低功耗喚醒,根據設備的基礎情況,我們還會提供更適合的算法方案,例如,針對臺燈、插座、低端的兒童玩具等小型、單一功能設備,且僅存在完全的近場喚醒需求類的產品,小模型語音喚醒方案即可滿足需求。但,對于耳機、手機、白電類等具備相對遠場需求的產品,雙麥遠場喚醒方案則更為合適。
該低功耗算法方案同樣具備超高的定制能力,例如喚醒詞定制,根據產品的目標人群年齡特征、地域特征的口音定制,根據產品應用的車載、商場、騎行等場景的噪聲環境定制,根據芯片選型、硬件設計等進行靈活組合與定制。
“算法+芯片”的深度融合,帶來了整體性能的升級。
思必馳攜手子公司深聰智能打造了低功耗AI語音芯片TH1520,通過軟硬件協同設計、優化整合型專用芯片,算法+芯片深度融合的嵌入式系統,取代通用芯片+通用算法的解決方案,打造可編程、定制化專用型 AI 深度學習架構,取代目前第三方通用型架構。目前,該芯片正式進入產品對接測試階段。
TH1520在處理遠場以及復雜聲場下的各項體驗指標處于業界領先,支持離線識別,可全離線應用,而且功耗極低,待機狀態功耗毫瓦級,全速工作功耗不大于百毫瓦,可用電池供電,使得便攜和移動場景成為可能,片內存儲亦可大幅節省成本和總體功耗。同時,算法+芯片的方案可進行快速移植與部署,將產品推向市場。
目前該方案可應用于智能耳機、智能手機、智能門鎖、智能臺燈等多款產品。思必馳也將不斷優化技術方案,為更多IOT產品帶來優質體驗。
越是體積小巧的設備,對功耗性能、集成工藝的要求越高。思必馳解決方案軟硬兼施,應對智能小家電的AI攻勢。
-
人工智能
+關注
關注
1791文章
47350瀏覽量
238754 -
智能語音
+關注
關注
10文章
786瀏覽量
48793
發布評論請先 登錄
相關推薦
評論