受訪嘉賓 | 何云鵬
啟英泰倫創始人兼CEO
六年時間,完成三次大迭代,三次小迭代。啟英泰倫AI芯片在不斷提升性能的同時,成本和功耗也在快速下降。隨著公司第三代主力AI芯片的逐步放量,啟英泰倫在行業智能化升級的浪潮中顯然已經進入發展的快車道。
作者:Joey
編輯:Melody
AI語音是人工智能的重要方向,也是各類智能家電設備最直接、最便捷的交互方式之一。
最近,芯八哥“走進產業鏈”欄目記者采訪了國內智能語音的領先企業——啟英泰倫的創始人兼CEO何云鵬,探討在AIoT時代智能語音高速發展的背景下,當前啟英泰倫企業的發展情況以及對行業未來發展的展望。
累計裝機量突破2000萬臺,在美的、海爾等一線家電品牌的覆蓋率已經達到80%以上
據了解,啟英泰倫成立于2015年,是一家專注于人工智能語音芯片及配套應用解決方案的專精特新企業。
經過多年的發展,目前在智能家居、智能家電、智慧照明等領域,采用啟英泰倫智能語音芯片或方案的直接客戶已經超過5000家,累計裝機量已經突破2000萬臺,在美的、海爾、海信、公牛等一線家電品牌的覆蓋率已經達到80%以上,芯片銷售成績突出。
啟英泰倫產品主要應用場景
資料來源:啟英泰倫
目前,家庭里面各種各樣的設備都處于從傳統的功能化往智能化方向演變的一個階段。在這個階段,傳統的遙控器、按鍵、或者遙控器/按鍵組合的方式,已經很難幫助智能設備去表達更豐富的功能,而更自然、更便捷的人機交互方式則可以讓這些設備的智能化功能夠更好地發揮出來。
何云鵬介紹道,
面對智能化升級巨大的市場機遇,啟英泰倫以家庭場景作為切入點,以端側語音交互作為突破口,專注于AI語音芯片及解決方案的研發和銷售,經過前幾年的鋪墊,公司已經步入發展快車道,今年銷售有望突破1億元。
啟英泰倫產品主要應用品類
資料來源:啟英泰倫
在智能語音芯片方面,啟英泰倫自成立以來相繼推出了CI100X、CI110X、CI130X、CI131X和CI230X三代系列產品,可廣泛應用于智能家電、智能家居等對人機交互有大量需求的領域。
作為公司第一代深度神經網絡語音AI芯片,CI1006于2016年推出。在性能上,CI1006可存儲500+本地命令詞條,具有10米左右全方位喚醒、命令識別反應速度0.2s、識別率高達98%等技術特點。
在首款芯片大獲成功之后,公司緊接著進行下一代產品的研發,并于2019年推出了行業首款降噪識別一體語音AI芯片CI110X系列(CI1102/CI1103)產品。
相較于第一代產品,CI110X系列產品集成更多、性能更強、功耗更低,可以實現“云+端”語音識別方案。具體來看,在架構上,CI110X系列芯片基于NPU+MCU架構設計,內置升級的BNPU v2,并新增了語音加速傳感器;性能方面,該系列芯片內置高性能低功耗Audio Codec模塊和硬件音頻處理模塊,可以外接麥克風實現單芯片遠場降噪和回聲消除等功能;落地應用方面,CI110X 系列最低功耗僅需35mW,可廣泛應用于低成本、低功耗的設備上,也可應用于智能音箱等需要獲取云端內容的設備中。
啟英泰倫主要芯片產品
資料來源:啟英泰倫
在前兩代產品的基礎上,2022年啟英泰倫又馬不停蹄發布了第三代智能語音芯片,包括CI130X、CI131X和CI230X兩大系列。
其中,CI130X系列支持單麥和麥陣語音增強、噪聲抑制、回聲消除、低功耗喚醒、本地語義理解、聲紋識別等語音算法,并首創離線NLP(自然語言處理)和命令詞自學習技術,可以讓設備在離線狀態下具備多輪對話、意圖理解、自主學習的功能;而CI230X系列是集“語音+WIFI+BLE”于一體的三合一AIoT芯片,且僅需少量電阻電容等外圍器件就可以實現各類智能語音離在線產品硬件方案,性價比極高。
上市之后,第三代產品憑借其出色的性能及語音識別能力,獲得了美的、海爾、格力等大客戶的一致好評,目前月銷量已達百萬級別,居于離線語音芯片市場銷售前列。
六年時間,三次大迭代,在解決行業需求痛點的同時,也為智能語音產品走進千家萬戶奠定了夯實的基礎。
在談及產品的迭代方向時,何云鵬指出:
公司是圍繞技術平臺來迭代的,其中最核心的一個技術就是腦神經網絡處理器,我們內部也稱為BNPU。從2016年的BNPU1.0版本,到現在的 BNPU 3.0版本,在每一代技術平臺的基礎上,我們在產品路線上又迭代了兩個小代,因此截至目前,公司差不多有6代相關的智能語音產品已經推向市場。
啟英泰倫完整語音算法鏈條
資料來源:啟英泰倫
經過不斷迭代,解決了兩個核心問題。何云鵬接著補充道,
第一是性能不斷得到提升。現在公司產品在安靜的情況下,識別率已經高達99%。更重要的是,通過語音降噪、雙麥克風處理降噪、深度學習通話降噪等噪音技術處理后,即使面對油煙機、浴室、風扇等區域內各種各樣的噪聲環境,識別率也能保持在非常高的水平之上;第二是成本不斷降低。從最初100塊錢左右的方案成本,發展至今現在成本降低到了不到10塊錢,已經達到一個在全社會可以全面普及應用的程度了。
打造“芯片+算法+方案+平臺”的完整閉環,以滿足客戶差異化的需求
智能語音應用領域非常廣,本質是一個碎片化的應用市場,因此每家客戶的需求都不一樣。
在早期,由于行業內沒有一個可供參考的開發平臺的概念,客戶做應用開發的時候就需要內部技術支持團隊花上幾個月的時間去支持一個項目,這樣研發和銷售效率就很差,并且一年下來也做不了多少項目。這種情況下要養活公司,要么只能收開發費用,要么就是只能把售價定的很高,但這并不適合智能語音產品的大規模銷售與普及。
我們很早就看到了這些行業痛點,為了滿足客戶差異化的開發需求,公司早在2017年就已經在著手開發智能語音AI平臺,在2018年測試完成后,于2019年向全社會發布。有了這個開發平臺后,客戶只需要具備一點編程的基礎,針對于不同產品、不同的邏輯協議都可以快速實現零代碼語音識別應用的開發,這樣就大大提升了客戶的開發效率和便捷度,也使得我們能夠同時滿足幾千家客戶的一個需求。
在談及為何要做解決方案平臺時,何云鵬說道。
發展至今,啟英泰倫AI平臺已經更新到V3.0版本,新增了第三方API接口、離線工具,向開發者開放了更多權限和功能,進一步解決了語音交互技術難點。開發者只需輸入文本或選擇應用參數,1分鐘即可自動生成語言模型,10分鐘即可生成可直接量產的固件,實現真正的簡單、高效、低門檻,極大縮短了客戶產品上市的周期。據公司披露,截至目前該平臺已服務客戶超過5000家,賦能個人開發者超過10萬人,實現了對300多個應用領域的覆蓋。
啟英泰倫AI平臺發展情況
資料來源:啟英泰倫
而在算法方面,啟英泰倫通過自研語音算法,在掌握傳統語音信號處理技術的基礎上,首創雙麥深度人聲分離、端側NLP、單麥深度學習降噪、命令詞自學習4項行業核心技術,極大提高了語音識別的準確性和自然性。
值得注意的是,為了增加產品的附加價值,更好地滿足客戶差異化的需求,啟英泰倫目前主要采用芯片產品+解決方案一起打包出售給客戶的模式來實現盈利。
具體來看,啟英泰倫目前已經具有離線語音方案、離線語音+藍牙+通話方案、離線+在線語音識別方案、離線語音+IoT方案等多種智能語音方案的開發能力。
啟英泰倫“離線語音+loT”方案
資料來源:啟英泰倫
以“離線語音+loT”方案為例,該方案采用啟英泰倫最新推出的三代智能語音芯片CI230X系列,集成WIFI和BLE的Combo功能,現已融合涂鴉云、騰訊云小微、騰訊連連、中移物聯等IoT平臺,用戶可以很便捷地進行設備的離線語音控制、手機App/小程序雙控和場景聯動,以實現IoT、云內容、語音交互的自然融合。
專注于家居家電專用市場,是終端離線智能語音行業的先驅者和領導者
作為人工智能應用最成熟的技術之一,凡是需要人機交互的領域,都可以采用智能語音芯片升級原來的控制交互方式,因此智能語音在近年來的智能化轉型中得到了快速的發展。
根據中國智能語音產業發展高峰論壇近日披露的數據,2022年全球智能語音產業規模將達351.2億美元,保持33.1%的高速增長;從我國來看,根據沙利文的統計數據,2022年我國智能語音市場將達356.8億元,同比增長18.30%,整體呈積極向好的發展態勢。
資料來源:沙利文咨詢
從競爭格局來看,國內外智能語音市場均已相對集中,在通用市場上Nuance、谷歌、蘋果、科大訊飛、百度等企業占據著主要份額。而在專用市場上,我國的云知聲、思必馳、啟英泰倫等企業則致力于搶占家居、車載等細分賽道。
對于當下行業發展的現狀,何云鵬表示:
隨著智能語音在應用場景上范圍不斷被拓展,市場空間越來越大。即使在當前消費電子不景氣的狀況下,智能語音的需求依然呈高速增長的一個發展態勢。不過,行業在正向發展的同時,目前市場高低端分化也越來越大。在中高端市場,相關廠商由于具備詞條數多、識別效果好、降噪性能及抗噪性能優等技術優勢,在市場競爭中逐漸與其他廠商拉開身位,這其中以啟英泰倫為代表;而在低端市場,智能語音芯片命令詞較少,只有在特別安靜的環境下才能做簡單的識別,由于技術壁壘低,那么這些廠商可能會面臨比較大的價格戰壓力而逐漸退出市場。
談及智能語音,科大訊飛是行業內繞不開的一個話題。作為我國當前智能語音領域的千億市值龍頭企業,科大訊飛已經在工業、汽車、教育、醫療等領域實現了全面布局。
何云鵬指出:
科大訊飛專注于通用市場,以云端應用為主,他們的特點體現在算法+云端應用上面。而我們專注于家電等專用市場,以終端應用為主,是行業內首批把智能語音做在終端上面并且能夠支持離線運行的公司,可以說是終端智能語音行業的先驅者和領導者,大家專注點不同,各有優勢。此外,我們還是 ‘芯片+算法+方案+平臺’的全棧式企業,擁有清晰穩定的芯片迭代的規劃,并且在市場上已經積累出了非常好的口碑,這是我們區別于科大訊飛等競爭對手的核心優勢所在。
當前,行業內處理智能語音有多種方式,常見的有在線語音、離線語音等分類。因為智能語音處理需要用到算力,所以剛開始都是用云端服務器提供算力來進行語音識別和語義處理。
在云端上處理有三個問題,第一個它沒有辦法去完全解決信號延遲、卡頓的問題;第二個就是它會實時的把用戶家庭里面的數據往云端傳,所以存在一定的隱私問題;第三個問題是因為它是實時的傳輸,所有的數據都是放在云端上計算的,意味著它的費用很高,要交很高的云平臺年費,這樣對于用戶來說就非常不經濟。
何云鵬分析道,
那我們通過技術創新,用離線語音的方式去做技術處理,就能很好以低成本的方式實現數據的安全穩定,并且能夠保護用戶隱私,從而有利于推動智能語音在各個領域的普及。我們第一代產品CI1006推出后,逐步開啟了智能語音行業離線控制家電的浪潮,以此奠定了啟英泰倫在離線語音家電領域的領先地位。
盡管當下面臨消費電子低迷、人口負增長等多種不利環境,但這絲毫沒有影響人類社會對智能化升級浪潮的發展,尤其在家電領域,擁有交互功能的產品已經成為終端廠商提升價值量的核心賣點。
六年時間,完成三次大迭代,三次小迭代。啟英泰倫產品在不斷提升性能的同時,成本和功耗也在快速下降。隨著公司第三代主力產品的逐步放量,啟英泰倫在智能化升級的浪潮中顯然已經進入發展的快車道。
*原創聲明:本文為芯八哥原創文章,以上授權僅針對公眾號,轉載請保持內容的完整性,并注明來源出處,所有內容不得刪減、修改,不得做商業用途,不允許網站及第三方平臺直接二次轉載,如需轉載請通過公眾號后臺私信開通白名單。
-
芯片
+關注
關注
456文章
50892瀏覽量
424354 -
AI
+關注
關注
87文章
31000瀏覽量
269335
發布評論請先 登錄
相關推薦
評論