2022年7月28日,“三芯起 萬物聲”啟英泰倫第三代語音芯片發(fā)布會如約而至。歷經(jīng)三年潛心研發(fā),啟英泰倫正式推出全新第三代智能語音芯片,相較上一代產(chǎn)品,這款芯片創(chuàng)下算力更高、高度集成和算法新高的“三高”記錄,全面覆蓋高性能、低成本端側(cè)語音和端云融合語音等應(yīng)用。
離線語音AI芯片的“先行者”
近年來,隨著5G、AIoT等技術(shù)的快速發(fā)展與應(yīng)用融合,人工智能產(chǎn)業(yè)及相關(guān)業(yè)務(wù)越來越受政府和產(chǎn)業(yè)界的關(guān)注與支持,在國家的“十四五”規(guī)劃中,人工智能技術(shù)已被列為前沿科技領(lǐng)域的“最高優(yōu)先級”,宏觀環(huán)境不斷向好發(fā)展。
在各類人工智能技術(shù)中,語音識別、自然語義理解(NLP)、機器學(xué)習(xí)居于重要地位,是人機交互技術(shù)的基礎(chǔ),其中,語音識別、NLP兩項均與語音交互密切關(guān)聯(lián)。作為人機交互中最符合人類日常交流形態(tài)的技術(shù),語音交互方式更加自然,也更為便利。
從產(chǎn)業(yè)發(fā)展的角度看,技術(shù)突破和政策利好有效刺激了智能語音行業(yè)的發(fā)展。不過,從更底層的邏輯出發(fā),人機語音交互體驗的持續(xù)改善才是市場的核心推動力。更長遠來看,智能語音的本質(zhì)其實是實現(xiàn)人機之間的語音自由交互。
在智能語音識別發(fā)展早期,由于語音識別對算力的要求高,企業(yè)都是通過云端進行智能語音識別處理。然而,在主流方向如此明晰的情勢下,啟英泰倫卻選擇另辟蹊徑,率先選擇了離線語音AI芯片的方向。
那么,啟英泰倫為何作出這一選擇呢?對此,啟英泰倫創(chuàng)始人兼CEO何云鵬表示,這一選擇的出發(fā)點是基于對用戶真實需求的深入思考。首先,離線語音是不依賴網(wǎng)絡(luò)和云中心的真智能,既能給用戶帶來即時的靈敏響應(yīng),也能更好地保護用戶的隱私。此外,出于對用戶權(quán)益的考量,離線語音能確保用戶擁有完整的、自主的智能設(shè)備使用權(quán)和控制權(quán)。最后,除用戶體驗外,還需考慮更廣泛的用戶的成本承受能力,不僅是讓用戶體驗更好,也能用得起。
近年來,隨著智能語音技術(shù)不斷發(fā)展和應(yīng)用的不斷拓展,云端處理在響應(yīng)可靠性、隱私保護、成本等方面的弊端逐步暴露出來。在端云融合的趨勢之下,啟英泰倫的這一選擇也愈發(fā)凸顯出其先見之明的一面。
BNPU 3.0將語音識別推向新高點
從實際應(yīng)用場景來看,智能語音的需求大致可以概括為語義理解、特征識別、語音處理、實時交互四個方面。為了更好地滿足上述用戶需求,啟英泰倫在算法攻關(guān)和芯片研發(fā)兩個方面同時發(fā)力,埋頭攻克一個又一個業(yè)內(nèi)難題。發(fā)展至今,啟英泰倫自研技術(shù)平臺BNPU(腦神經(jīng)網(wǎng)絡(luò)處理器)已迭代三次,從BNPU1.0、BNPU2.0,一直到今天推出的BNPU3.0版本。
每一代BNPU的問世,都是離線語音芯片和算法的一次突破和語音應(yīng)用的助推。何云鵬介紹道,第一代BNPU實現(xiàn)的是端側(cè)語音識別,是行業(yè)首款集成神經(jīng)網(wǎng)絡(luò)處理器的語音AI芯片,也是離線語音產(chǎn)業(yè)應(yīng)用興起的標志。二代系列芯片CI1102/CI1103及CI1122芯片則集成了第二代BNPU,不僅實現(xiàn)了離線語音識別功能,還能實現(xiàn)離線聲紋識別和命令詞自學(xué)習(xí)等個性化的功能。如今,第三代芯片又將把整個語音識別應(yīng)用推向新的高點。
從芯片算力方面看,三代13系列芯片內(nèi)置BNPU 3.0和支持DSP指令擴展的RISC CPU兩大內(nèi)核,主頻高達240MHz,并具有640KB系統(tǒng)SRAM。
何云鵬指出,在實際應(yīng)用中,用戶對智能語音的要求極高,對于一個能聽會說的設(shè)備,常以機器人,甚至超人的標準對待。比如,在人耳也不易聽清的嘈雜環(huán)境中,會希望語音設(shè)備能聽清;人耳很難同時聽懂兩個以上人說話,但要求語音設(shè)備能聽懂。此外,很少有人能聽懂各地的方言口音,但各地方的人會要求設(shè)備聽得懂該地方言,甚至土話。
為了滿足上述苛刻要求,第三代BNPU作了大量技術(shù)迭代。除繼承第二代的語音識別、聲紋識別外,還支持了基于深度學(xué)習(xí)的降噪技術(shù)(深度降噪),人聲分離技術(shù)(深度分離),命令詞自學(xué)習(xí)2.0版本技術(shù),以及行業(yè)首次突破性的離線NLP技術(shù)。
此前,業(yè)界普遍認為只有云端才能實現(xiàn)NLP,而啟英泰倫最新的技術(shù)已經(jīng)可以采用端側(cè)智能語音芯片實現(xiàn)NLP,將語音處理放在端側(cè),既保障了用戶的體驗感,又能降低云端搭建和運營成本,降低網(wǎng)絡(luò)帶寬消耗,也能提升用戶使用的安全性。
為了幫助下游客戶實現(xiàn)敏捷開發(fā)、快速落地的目標,啟英泰倫還推出了語音AI平臺。該平臺支持10000用戶同時開發(fā),即時生成NLP模型,提供更自然的語音交互能力。
為用戶打造專屬守護精靈
隨著互聯(lián)網(wǎng)、5G和Wi-Fi等技術(shù)的快速發(fā)展,智能行業(yè)正從“單點智能”走向“情景智能”,專業(yè)的智能語音芯片技術(shù)在這一轉(zhuǎn)變中扮演著至關(guān)重要的角色。
由于智能語音技術(shù)和NLP技術(shù)不斷加速發(fā)展,智能語音的市場空間不斷打開。目前,智能語音已在2C消費級的智能家居、智慧生活、智慧辦公、智能駕駛;2B企業(yè)級的智慧醫(yī)療、智能客服等多個領(lǐng)域?qū)崿F(xiàn)場景應(yīng)用。據(jù)IDC的統(tǒng)計數(shù)據(jù),2021年中國智能家居設(shè)備市場出貨量已超2.2億臺,2022年中國智能家居設(shè)備市場出貨量則將突破2.6億臺,同比增長為17.1%。
經(jīng)過長達近7年的發(fā)展后,啟英泰倫積累的B端客戶已超過5000名,平臺開發(fā)者則超過了1萬名,使用啟英泰倫智能語音平臺的在校AI學(xué)員則超過10萬名。離線語音方案的年裝機量則超過2000萬,并正快速向上億年裝機量發(fā)展。
啟英泰倫的終極目標是打造跨設(shè)備、跨時空,用戶專屬,終身守護的守護精靈。何云鵬將這一目標劃分為三個階段,第一步是讓人機交互更自然,更具普適性;然后通過更多的數(shù)據(jù),讓機器更理解人、更主動地為人類服務(wù);最終目標是打造專屬的守護精靈,它將是用戶全方位的生活管家、健康安全衛(wèi)士、百科知識導(dǎo)師和給與心靈陪伴的知己朋友。
為了更快地實現(xiàn)自身目標,啟英泰倫正加強生態(tài)建設(shè),提升應(yīng)用開發(fā)平臺,和合作伙伴們一切推動生態(tài)建設(shè),努力降低AI語音應(yīng)用的門檻。對于啟英泰倫的理想,何云鵬感慨道“那些站在民族和人類立場的美好愿望,一個人的力量是微薄的,但多一份總會更好!一個人這么想,就會有更多人這么想,最終匯聚成浩浩蕩蕩一往無前的力量!”
-
語音
+關(guān)注
關(guān)注
3文章
385瀏覽量
38028 -
AI芯片
+關(guān)注
關(guān)注
17文章
1880瀏覽量
34994 -
啟英泰倫
+關(guān)注
關(guān)注
1文章
47瀏覽量
1426
發(fā)布評論請先 登錄
相關(guān)推薦
評論