作者 | 杭瑩
來源|羊城晚報(bào)
2015年-2016年,生物識(shí)別行業(yè)的十年老兵李亞桐感知到AI技術(shù)正在點(diǎn)燃行業(yè)熱潮。人臉識(shí)別、人像技術(shù)成為“風(fēng)口上的豬”,學(xué)術(shù)界、產(chǎn)業(yè)界都開始走出來進(jìn)行創(chuàng)新創(chuàng)業(yè)。
創(chuàng)業(yè)潮自然也波及到了李亞桐的內(nèi)心。但他想做點(diǎn)不一樣的。“既然刷臉可以,那么刷聲音行不行?”“遠(yuǎn)程業(yè)務(wù)過分發(fā)達(dá)后,是否會(huì)帶來弊端?”帶著這些問題和外界啟發(fā),李亞桐開始探索聲紋識(shí)別。而故事的結(jié)果,是他與張偉彬博士、陳東鵬博士?jī)晌缓匣锶艘黄饎?chuàng)立了深圳市聲揚(yáng)科技有限公司(下稱“聲揚(yáng)科技”)。
聲揚(yáng)科技三位聯(lián)合創(chuàng)始人:CTO陳東鵬博士(左)、總經(jīng)理張偉彬博士(中)、董事長(zhǎng)李亞桐(右)聲揚(yáng)科技的總部就在深圳香港中文大學(xué)深圳研究院內(nèi),當(dāng)羊城晚報(bào)記者來到這里時(shí),只覺樓宇間的科研與沉穩(wěn)風(fēng),實(shí)在和聲揚(yáng)科技的氣質(zhì)相配的很。
聲揚(yáng)科技以聲紋識(shí)別技術(shù)為“語(yǔ)音安全底座”,自研全棧智能語(yǔ)音技術(shù),覆蓋前端聲學(xué)信號(hào)采集、語(yǔ)音信號(hào)處理到后端特征提取識(shí)別全流程。其團(tuán)隊(duì)集結(jié)了來自清華、復(fù)旦、香港科技大學(xué)、香港中文大學(xué)、康奈爾等全球頂尖高校的技術(shù)人才,核心產(chǎn)品線涵蓋金融聲紋反欺詐、智慧公安音頻分析及智能座艙終端語(yǔ)音等領(lǐng)域,在政府機(jī)構(gòu)和大型企業(yè)中得到了廣泛應(yīng)用,市場(chǎng)占有率持續(xù)領(lǐng)先。
用聲音DNA進(jìn)行身份識(shí)別
走進(jìn)聲揚(yáng)科技,入口的展廳墻上掛著一副發(fā)展藍(lán)圖。聲揚(yáng)科技聯(lián)合創(chuàng)始人、董事長(zhǎng)李亞桐告訴羊城晚報(bào)記者,6年前公司從原先的辦公點(diǎn)搬到這里,但這幅圖一直沒有變過。藍(lán)圖上的內(nèi)容,就是以音頻處理和語(yǔ)音分析為核心,提供基于語(yǔ)音技術(shù)的信息安全服務(wù)。
聲紋識(shí)別服務(wù),在當(dāng)時(shí)還未有人能實(shí)現(xiàn)大規(guī)模商業(yè)化應(yīng)用。2018年聲揚(yáng)科技首次與合作伙伴一起完成了印度尼西亞的居民養(yǎng)老金提取遠(yuǎn)程聲音確認(rèn)項(xiàng)目,可以稱得上是首創(chuàng)。當(dāng)然,在這背后,年輕的團(tuán)隊(duì)經(jīng)歷了太多挑戰(zhàn)。
聲揚(yáng)科技聲紋識(shí)別技術(shù)惠及250萬(wàn)印尼老人足不出戶領(lǐng)取養(yǎng)老金語(yǔ)音分析技術(shù)如何在客戶需要的場(chǎng)景下進(jìn)行優(yōu)化?用戶如何使用產(chǎn)品?交互設(shè)計(jì)怎樣才能更符合使用習(xí)慣?這些是橫在研發(fā)技術(shù)端的實(shí)際問題。而在這之外的,是一個(gè)新鮮事物要如何讓客戶相信它是可靠的、并且愿意為之買單。
在國(guó)內(nèi),相似的應(yīng)用從有產(chǎn)品雛形到項(xiàng)目初次落地,用了兩年多時(shí)間。當(dāng)聲揚(yáng)科技的語(yǔ)音分析技術(shù)嵌入到對(duì)方的產(chǎn)品模塊或部署于后臺(tái)系統(tǒng)后,系統(tǒng)可以通過聲紋識(shí)別來驗(yàn)證說話人的身份,又通過聲音的活體檢測(cè),來識(shí)別電話中的對(duì)方是否為真人聲音而不是錄音,以達(dá)到身份驗(yàn)證和生存性驗(yàn)證的效果。
商業(yè)化在海外和國(guó)內(nèi)都獲得大型客戶成功驗(yàn)證后,李亞桐和團(tuán)隊(duì)獲得了極大的信心。在聲紋識(shí)別技術(shù)的基礎(chǔ)上,團(tuán)隊(duì)進(jìn)一步研發(fā)出了2個(gè)產(chǎn)品,分別為“VoiceKEY”和“VoiceDNA”。顧名思義,KEY即聲音像鑰匙一樣可以進(jìn)行登錄解鎖,DNA即聲音身份識(shí)別,當(dāng)身份造假時(shí)可以用聲音DNA進(jìn)行檢測(cè)。
由此,聲揚(yáng)科技在國(guó)內(nèi)的業(yè)務(wù)主線也開始明確。
撬動(dòng)人工智能的信息安全應(yīng)用
2018年開始,聲揚(yáng)科技開始和公安系統(tǒng)合作,幫助公安、司法部門的刑事偵查、專業(yè)鑒定等任務(wù)進(jìn)行信息采集、識(shí)別、鑒定、聲音數(shù)據(jù)清洗和處理等。
截至目前,聲揚(yáng)科技已和全國(guó)超200個(gè)省市縣級(jí)公安機(jī)關(guān)合作。聲揚(yáng)科技有一個(gè)專門的團(tuán)隊(duì),隨時(shí)奮戰(zhàn)在一線,協(xié)助全國(guó)各地公安部門解決工作中遇到的各類聲音識(shí)別技術(shù)問題。
而另一方面,VoiceDNA也應(yīng)用到了金融安全維度。“‘VoiceDNA’具備身份驗(yàn)證、黑名單識(shí)別、團(tuán)伙欺詐識(shí)別、多頭檢測(cè)等反詐能力,適用于貸前反欺詐、 惡意客訴識(shí)別、反催收中介識(shí)別等場(chǎng)景。”李亞桐表示。目前,聲揚(yáng)科技和中國(guó)工商銀行、中國(guó)農(nóng)業(yè)銀行、中國(guó)人壽等都有合作。據(jù)了解,聲揚(yáng)科技為工商銀行總行聲紋識(shí)別產(chǎn)品項(xiàng)目的唯一供應(yīng)商,2020年6月起在陜西、四川等四個(gè)分行上線,1年內(nèi)阻止了經(jīng)濟(jì)損失兩千萬(wàn)元,讓工商銀行業(yè)務(wù)審核效率提升了125倍。
公共安全和金融安全,成為聲揚(yáng)科技信息安全業(yè)務(wù)的兩條大腿,這兩個(gè)板塊的需求是快速增長(zhǎng)狀態(tài)的。“當(dāng)前我們的經(jīng)濟(jì)發(fā)展速度太快了,在這個(gè)過程中會(huì)涌現(xiàn)出無數(shù)的問題,需要依靠技術(shù)手段進(jìn)行精準(zhǔn)識(shí)別、以保護(hù)居民和國(guó)家的財(cái)產(chǎn)安全。”李亞桐保守估計(jì)道,人工智能在安防領(lǐng)域的應(yīng)用市場(chǎng)規(guī)模是萬(wàn)億級(jí)別的,而聲揚(yáng)科技如今撬動(dòng)的還只是冰山一角。
憑借著在技術(shù)端的不斷攻堅(jiān)克難,聲揚(yáng)科技也被深圳市認(rèn)定為深圳市“專精特新”中小企業(yè),并成為了廣東省人工智能聲紋工程技術(shù)研究中心、國(guó)家高新技術(shù)企業(yè)。
不斷開拓終端語(yǔ)音需求
2023年,我國(guó)汽車產(chǎn)銷量分別完成3016.1萬(wàn)輛和3009.4萬(wàn)輛,同比分別增長(zhǎng)11.6%和12%,產(chǎn)銷量連續(xù)15年穩(wěn)居全球第一。其中,新能源產(chǎn)銷分別完成958.7萬(wàn)輛和949.5萬(wàn)輛,同比分別增長(zhǎng)35.8% 和37.9%,市場(chǎng)占有率達(dá)到31.6%。
新能源汽車市場(chǎng)的的蓬勃發(fā)展,讓聲揚(yáng)科技團(tuán)隊(duì)嗅到了另一絲商機(jī)。2019年,聲揚(yáng)科技開始開辟智能座艙產(chǎn)品線,為車企提供智能座艙的語(yǔ)音信號(hào)處理技術(shù)。“能夠被國(guó)內(nèi)新能源頭部車企選中,體現(xiàn)了我們作為專業(yè)廠商的技術(shù)優(yōu)勢(shì)。而對(duì)人聲進(jìn)行分析處理,本來就是我們最擅長(zhǎng)的事。”他說。
通過“VoiceKEY”、“JustVoice”系統(tǒng)的搭載,新能源汽車可以實(shí)現(xiàn)聲紋開鎖,藍(lán)牙通話過程中的聲源定位、回聲消除、智能降噪等。“麥克風(fēng)錄入的聲音是疊加在一起的。如何在嘈雜的環(huán)境音、空調(diào)聲等各種聲波中將噪聲部分摘除,只保留人聲、且不影響聲音音質(zhì)。就像在一盆清水中滴入一滴紅墨水后,要將其再撈出來一樣。”李亞桐向記者描述了這個(gè)過程。
而對(duì)汽車來說,不同車型內(nèi)部結(jié)構(gòu)不同,反射混響也都各有差異,需要針對(duì)不同車型進(jìn)行差異化參數(shù)調(diào)整。截至2023年底,聲揚(yáng)科技智能座艙累計(jì)量產(chǎn)授權(quán)已超過220萬(wàn)輛乘用車、定點(diǎn)30余款車型,在同期國(guó)內(nèi)新能源汽車總產(chǎn)量的占比超過11%。
應(yīng)用場(chǎng)景的不斷拓展,背后是研發(fā)的不停嘗試與創(chuàng)新。據(jù)李亞桐透露,聲揚(yáng)科技每年的研發(fā)成本占據(jù)營(yíng)收的50%以上。
在聲揚(yáng)科技的官方介紹里,有一句話是“做大模型的耳朵”。對(duì)此,李亞桐解釋道,當(dāng)大模型強(qiáng)大的軟件能力與這些硬件結(jié)合時(shí),人機(jī)交互的模式也將被重構(gòu),“語(yǔ)音對(duì)話式交互”將是最主流的方式之一,這令很多現(xiàn)有的終端產(chǎn)品,都值得用大模型重做一遍,從而直接為大模型的“耳朵”——語(yǔ)音數(shù)據(jù)的采集工具(如麥克風(fēng)陣列)及相關(guān)的終端語(yǔ)音帶來了新的增量需求,而這恰好是聲揚(yáng)科技的強(qiáng)項(xiàng)。
今年3月,聲揚(yáng)科技完成了由青島某地方國(guó)資平臺(tái)出資及部分老股東跟投的新一輪融資,為2023年以來低迷的AI語(yǔ)音一級(jí)市場(chǎng)中的一抹亮色。據(jù)了解,本輪融資將主要用于以安防為核心的傳統(tǒng)業(yè)務(wù)市場(chǎng)拓展,以及大模型應(yīng)用生態(tài)所催生的終端語(yǔ)音產(chǎn)品矩陣的研發(fā)布局。
-
聲紋識(shí)別
+關(guān)注
關(guān)注
3文章
140瀏覽量
21519 -
聲紋支付
+關(guān)注
關(guān)注
0文章
5瀏覽量
2433 -
聲揚(yáng)科技
+關(guān)注
關(guān)注
0文章
29瀏覽量
2756 -
大模型
+關(guān)注
關(guān)注
2文章
2423瀏覽量
2640
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論