阿里巴巴人工智能實驗室前段時間在北京鼓樓時間博物館舉辦了2017年夏季新品發布會,正式發布了旗下首款智能音箱天貓精靈X1,內置智能語音助手AliGenie。它能夠聽懂中文普通話語音指令,并實現智能家居控制、語音購物、手機充值、音樂播放等功能。天貓精靈X1智能音箱售價499元,將在8月8日限量1000臺公測發售。
從亞馬遜三年前的無心插柳到今天阿里的入局,智能音箱市場的爆發讓人始料未及,但這的確發生了。
Echo已累計銷售近2000萬臺,谷歌、微軟、蘋果隨之跟進,之后的一段時間里,國內的軟件廠商、硬件產商、內容廠商爭相進入,好不熱鬧。
而直到本月初,阿里才正式發布智能音箱天貓精靈X1,既出乎意料又在情理之中,使得語音入口的爭奪戰因為阿里的入局變得更加有趣。
那么,阿里的智能音箱到底帶來了哪些有別于其他同類產品的驚喜?
眼前一亮的“驚喜”
此前有媒體稱,為了這款智能音箱,阿里巴巴甚至將馬云投入上億美元的Pepper機器人項目中止,把人員隊伍拆分劃進人工智能實驗室。而花了這么大代價出來的產品好像似乎與Echo等音箱并無本質上的差異,所含功能大致包括播音樂、叫外賣、查天氣、設鬧鐘、智能家電操控等。
根據天貓精靈對外宣傳的賣點,其中非常重要一點就是連Echo都不具備的聲紋識別功能。
阿里稱,通過聲紋識別技術,音箱可以分辨家里的每一個人,并且根據每個人的喜好而設定推送不同的內容,目前最多可以識別6個人的身份;另外,用戶還可通過自己的聲音完成購物支付驗證環節。而Echo在分辨人的身份上,還需要通過進一步操作來獲取用戶的個人信息。
讓小編好奇的是,如此酷炫的功能為何亞馬遜至今都還沒用在Echo上。
據悉,亞馬遜很早就想應用這項技術,但據亞馬遜員工介紹,從聲紋識別領域的硬件和軟件公司中得到的反饋看來,讓這些語音控制設備去識別不同用戶的聲音比想象中要艱難很多。
“由于設備需要去除噪音,回聲,混響,使得它難以對聽到的發聲者的身份進行識別。”Conexant語音部門副總裁Vineet Ganju說道。
那么擁有聲紋識別的天貓精靈真的能撐起它所重點訴求的這個賣點嗎?
我看懸。
聲紋識別功能為什么懸?
先從聲紋識別算法層面講,聲智科技創始人陳孝良博士此前在接受專訪時表示,聲紋識別還是一個比較窄的學科,應用也相對較少。現在大部分研究都是有關動態實時檢測,動態檢測的方法自然要利用靜態檢測的各種原理方法,同時也需要增加其他很多算法, 比如VAD、降噪、去混響等。VAD的目的是檢測是不是人的聲音,降噪和去混響是排除環境干擾。
VAD常用兩個方法,基于能量檢測和LTSD(Long-Term Spectral Divergence),當前用的較多是LTSD,另外特征提取方面還需要:動態時間規整(DTW)、矢量量化 (VQ)、支持向量機 (SVM),模型方面則需要隱馬爾可夫模型(HMM)和高斯混合模型 (GMM)。
從上面模型不難看出,聲紋識別還是一種基于數據驅動的模式識別問題,因為所有模式識別存在的問題聲紋都存在,而且聲紋識別還有一些不太好解決的物理和計算問題。
聲紋識別的唯一性很好,但實際上現有的設備和技術仍然很難做出準確分辨,特別是人的聲音還具有易變性,易受身體狀況、年齡、情緒等的影響。若在環境噪音較大和混合說話人的環境下,聲紋特征也是很難提取和建模的。 現階段,遠場聲紋識別理論并不成熟,研究進展也不大。
陳孝良認為,深度學習帶給模式識別極大的提升,甚至還有開源的相關算法,但是聲紋識別的研究進展仍然不大,這仍然受制于聲紋的采集和特征的建立。
聲紋識別提供商SpeakIn資深科學家陳東鵬博士談到,從聲紋識別這一單項技術來講,容易受到真實環境下的各種影響,包括:噪音問題、多人說話、身體狀況、情緒影響等,現在確實很棘手。包括他們在內的一些公司也在大力通過軟、硬件算法去優化這些行業通用問題,在深度學習的加持下,整個行業的進步也比以往更快。陳博士補充到,聲紋識別只是一個環節,效果判斷還需看產品本身和使用場景等因素。
在產品層面,剛剛發布“小雅”智能音箱的喜馬拉雅表達了他們的看法。喜馬拉雅副總裁李海波表示,對于聲紋識別的應用,公司內部也攻關了很久,但無法做到完全準確,目前還只是實驗階段,效果一般。
在談及阿里天貓精靈時,他講到,遠場語音識別通常在三米到五米內有效,降噪是在70dB左右,環境噪音和音響聲音大于這個標準就很難喚醒。而遠場聲紋識別在同等距離下就更加不穩定,目前客廳、電視機、廚房、床頭是智能音箱的四個常用場景,而除了床頭外,其他三個常用場景實際距離通常情況均超過三米,所以阿里音箱聲紋識別的具體實用性還不可得知。
至于亞馬遜Echo為何至今還沒用這個功能,李海波認為該技術還不成熟,雖然很炫但風險很大。
另外,Sensory公司的CEO Todd Mozer也認為對Echo這樣的遠場語音設備來說,識別誰在說話是很困難的。隨著信號/噪聲比例提高,設備的表現隨之變差。
“降噪和從噪聲中分離語音的處理對于用戶身份的識別有非常大的影響,目前為止,市場上還沒有產品同時處理好用戶身份識別,遠場語音和噪聲處理。”Mozer說道。
再從遠場聲紋識別的實際應用情況來看,中科院自動化所、極限元資深智能語音算法專家劉斌談到了他的看法。劉博士表示,遠場語音識別受到噪聲、回聲、混響的干擾,無論是語音識別還是聲紋識別都很具有挑戰性。
目前遠場語音識別可靠的識別距離大約是3-5米;對于聲紋識別還要更難一些。因為語音識別的目的是理解語音信號中的言語內容,言語內容信息跟共振峰高度相關,共振峰主要集中在低頻帶,語音信號低頻帶能量較高,受外部干擾相對較小,而說話人相關特征更多集中在高頻帶,語音高頻帶能量相對較低,更容易收到各種干擾的影響,因此遠距離聲紋識別更具挑戰。他隨即說到,因為每個人說話特征會隨著不同因素而變化,例如感冒時發音跟正常時肯定有所差異,所以近場聲紋識別還不敢保證特別成熟,遠場條件下肯定不太容易實用。總體來說,對于大多數用戶,聲紋識別應用于智能音箱并不是剛需,從技術角度分析,聲紋識別尚不成熟。
那么,相比遠場語音識別來說,更加不成熟的遠場聲紋識別技術為何會被阿里急著應用到音箱中呢?
除了用此技術滿足用戶的個性化需求尋求差異化搶占市場外,劉博士還提到,介于阿里在電商領域的一些積累和優勢,應用在電商身份認證也是阿里重點推進的方向。
阿里基于淘寶、天貓巨大的資源優勢將購物場景引入音箱中聽上去無可厚非,但從之前亞馬遜將此場景應用在Echo上來看,用戶用其購物的使用頻率并不高,使用體驗也不理想。
科大訊飛執行總裁胡郁此前接受雷鋒網采訪就說到,從整個市場來看,購物場景應用于音箱中還非常不成熟。真需求一定是用來滿足用戶剛需行為的功能,雖然Echo現在賣的很好,但調查后發現,用戶真正用得比較多的工具不過是設個提醒、查個天氣等等。之前亞馬遜大力推的Echo語音購物功能并沒有做起來,當用戶用語音交互的形式去買東西時,會發現里面各個環節和場景挺麻煩,還不如直接在屏幕操作來的方便。
所以這也是很多企業一直在強調語音交互要和視覺呈現的原因,因為用戶在面對沒有視覺呈現的情況下,你獲得的信息不夠,這時候很難完成一些復雜的操作。所以有些功能和場景都是我們自己憑空想出來的,直到真正投入實際使用時卻發現用戶的思維與行為習慣并不是產品設計的那樣。
這里可以看出,如果用戶連使用電商功能的習慣都尚未養成,且聲紋技術問題重重,那么在電商中加入聲紋識別的訴求,目測也很難以經得住市場考驗。
總體來看,阿里此次在智能音箱中加入聲紋識別的出發點很好:大打Echo和京東叮咚都沒有的功能營銷牌,在同質化產品浪潮中,用前沿技術來提升競爭力。
但在整個技術和市場尚未成熟之際,阿里在音箱中嫁接聲紋識別,這步棋怕是走早了一步。
相關推薦
據合伙人信息,該企業由阿里巴巴(中國)網絡技術有限公司及其下屬的杭州航運管理咨詢有限公司,天津和創匯....
發表于 2023-09-26 15:13?
1070次閱讀
阿里新任CEO吳泳銘發全員信 創業心態 AI驅動 用戶第一 阿里正式交棒到吳泳銘手上,阿里新任CEO....
發表于 2023-09-12 15:24?
607次閱讀
阿里張勇時代正式落幕 跟馬云一樣也在教師節之際辭任 在2023年9月10日教師節之際,張勇正式卸任阿....
發表于 2023-09-11 16:11?
162次閱讀
阿里巴巴旗下的阿里云智能正在考慮在鄉市場即將到來之際,在國有企業進行一次私募融資。籌資金額預計將從1....
發表于 2023-09-05 14:48?
329次閱讀
在普通ipo中,投資銀行為獲得支付最多費用的機會而爭奪龍頭。據了解情況的人透露,巴克萊銀行、高盛銀行....
發表于 2023-08-18 10:51?
384次閱讀
gh200和mi300參數對比 近年來,人們的生活越來越離不開智能家居設備,其中智能音箱是不可或缺的....
發表于 2023-08-17 10:51?
169次閱讀
摘要:智能音箱FCC認證辦理流程,AI智能音箱擁有更加人性化的操控和功能,而且也不僅僅是如普通音箱只....
發表于 2023-07-18 09:10?
170次閱讀
與進擊的美團不同,抖音卻收縮了自身的業務線。據悉,曾在2023年初推出的抖音外賣將調整經營策略,在放....
發表于 2023-07-10 17:09?
578次閱讀
都市白領李薇下班走進她的公寓。 智能門鎖通過臉部識別幫她打開屋門,然后就聽到熟悉的語音助手問候,“歡....
發表于 2023-07-06 17:10?
247次閱讀
阿里巴巴 Arthas 是一個診斷工具,可以用于監視、分析和解決 Java 應用程序的問題。使用 A....
發表于 2023-07-05 11:21?
161次閱讀
構建安全可信的數字世界 目前AI快速發展,人工智能賦能千行百業,為經濟社會高質量發展提供新動能。那么....
發表于 2023-06-28 11:16?
418次閱讀
阿里再變革 張勇退出集團CEO和董事會主席轉向阿里云 阿里“24年以來最大變革”進行中,阿里再變革;....
發表于 2023-06-21 19:16?
273次閱讀
電子發燒友網報道(文/黃山明)數據顯示,2023年一季度,中國智能音箱線上的檢測零售量僅為157萬臺....
發表于 2023-06-20 08:54?
625次閱讀
智能家居是利用先進的計算機技術、網絡通訊技術、綜合布線技術、和醫療電子技術依照人體工程學原理,融合個....
發表于 2023-06-12 17:04?
4644次閱讀
隨著全球對環境保護和氣候變化問題的日益關注,電動汽車作為一種環保、節能、高效的交通工具,受到越來越多....
發表于 2023-06-08 10:29?
372次閱讀
相較于當前的發展,中國大學生更看重把握未來的機會 上海2023年6月7日?/美通社/ -- 優興咨詢....
發表于 2023-06-07 16:33?
837次閱讀
本文是關于開發者 喬幫主 分享了在Docker環境下,基于博流BL606P音視頻開發板,進行智能音箱....
發表于 2023-06-06 17:11?
1007次閱讀
數據顯示,中國智能音箱在線上的監測零售量從2023年第一季度開始降至157萬臺,大跌40.6%。
發表于 2023-06-01 17:54?
825次閱讀
到了5月18日,這就變成了現實。阿里最新財務報告稱,云智能集團將完全脫離阿里巴巴集團獨立上市。潮州集....
發表于 2023-05-31 14:26?
348次閱讀
智能音箱功能應該是比較多的,也一直沒有徹底從代碼層面能明白其實現邏輯,估計多半跟后臺的云服務有關,需....
發表于 2023-05-26 14:22?
146次閱讀
音頻功放IC是各類音響、耳機等器材不可或缺的一部分;音頻功率放大器芯片俗稱“擴音器”,是音響系統中最....
發表于 2023-05-24 10:29?
754次閱讀
聽說智能家居會發瘋
發表于 2023-05-24 09:08?
1319次閱讀
智能音箱大多情況下只能實現一問一答或者十分簡單的溝通,依托于生成式AI技術在內容生成和理解能力上的優....
發表于 2023-05-10 15:20?
651次閱讀
近幾年人工智能等技術的不斷發展,AI智能音箱已成為炙手可熱的爆款;眾多企業紛紛加入其中;如我們熟知的....
發表于 2023-05-10 11:20?
921次閱讀
本文是關于開發者 qinyunti 基于BL606P-DVK開發板實戰開發的系列文章中的一篇,主要介....
發表于 2023-05-09 11:22?
313次閱讀
感受至臻優雅之聲,聆聽浪漫雅致之音,哈曼集團旗下豪華時尚音響品牌哈曼卡頓harman/kardon ....
發表于 2023-05-08 10:40?
364次閱讀
WTM2101在運行這類高算力AI算法時,可將功耗降低到微安級別,讓僅有數十毫安電池的可穿戴設備同樣....
發表于 2023-04-23 15:15?
385次閱讀
廣州2023年4月13日?/美通社/ -- 近日,國際獨立第三方檢測、檢驗和認證機構德國萊茵TUV大....
發表于 2023-04-14 10:28?
373次閱讀
以TensorFlow為backend ,算子數量多;此前,我們通過算子融合(類Faster Tra....
發表于 2023-03-24 17:06?
1464次閱讀
應用層協議正是Matter的核心所在,決定了該技術在市場中的生命力,構建于IPv6之上的應用層協議,....
發表于 2023-03-15 11:03?
501次閱讀
2022云棲大會上,阿里巴巴宣布自研CPU倚天710已大規模應用。 編解碼場景實現80%的性價比提升....
發表于 2023-02-24 17:03?
2352次閱讀
亞組委攜手阿里巴巴:云計算助力下 杭州亞運會有望成為最綠色亞運會 2月21日,“綠色亞運·低碳有你”....
發表于 2023-02-24 16:53?
1339次閱讀
阿里2022年第四季度營收2477.6億 凈利潤為499.32億 阿里巴巴公布了2023財年第三季度....
發表于 2023-02-24 16:48?
2734次閱讀
AD82584F兼容替代TAS5707/TAS5711,用于智能音箱語音辨識的2x25W立體聲數字音....
發表于 2023-02-13 22:42?
327次閱讀
從19世紀80年代愛迪生的留聲機和喇叭揚聲器開始,一代又一代工程師追求這一理想,發明和開發了無數項技....
發表于 2023-02-06 14:52?
295次閱讀
1月12日,吉利控股集團與阿里巴巴集團簽署戰略合作協議。吉利控股集團首席執行官李東輝、阿里巴巴集團首....
發表于 2023-01-14 10:20?
1696次閱讀
他們拆解的第四代Echo Dot在PCB和上半部分組件的其余部分之間有兩條電纜:此處所展示的相同帶狀....
發表于 2022-12-27 11:29?
2467次閱讀
對于進入B端市場,筆者有幾個小建議。首先,選對領域很重要。企業應當思考目前業務所處的能力圈,在主營業....
發表于 2022-12-14 10:56?
475次閱讀
隨著智能音箱的火熱以及背后語音交互生態的成熟,越來越多的設備語音化、智能化,使語音真正成為人機交互的....
發表于 2022-12-06 16:26?
626次閱讀
前端信號處理是在喚醒前進行準備工作,音箱工作時,麥列處于拾音狀態,當接收到聲音時,對聲音進行處理,包....
發表于 2022-11-30 16:10?
323次閱讀
電子發燒友網報道(文/吳子鵬)日前,有外媒報道稱,亞馬遜首席執行官安迪·賈西正在牽頭削減公司成本,包....
發表于 2022-11-14 07:42?
3826次閱讀
智能音箱通過尖端的語音識別人工智能技術和高音質來持續提升我們的生活體驗。當與其他的家庭自動化設備(如可視門鈴、...
發表于 2022-11-09 06:11?
199次閱讀
在11月3日開幕的2022云棲大會上,阿里巴巴董事會主席兼首席執行官張勇表示,科技是阿里巴巴從過去走....
發表于 2022-11-04 10:26?
443次閱讀
11月3日,在2022杭州云棲大會上,阿里巴巴公布了自研算力體系新進展,其自研CPU倚天710已經在....
發表于 2022-11-03 11:39?
643次閱讀
知名市場調研機構IDC近期 發布了2022第二季度《中國智能家居設備市場季度跟蹤報告》,數據顯示20....
發表于 2022-10-14 09:36?
621次閱讀
智能音箱是通過語音指令實現“隔空操作”,達到與智能家居交互目的的工具。但據近期報告顯示,2022 年....
發表于 2022-10-12 14:05?
618次閱讀
提起智能家居,大多人下意識會想到一臺智能音箱、一把智能門鎖、一個智能馬桶,卻不會浮現出一個完整的“智....
發表于 2022-10-11 12:15?
1127次閱讀
電子發燒友網報道(文/李誠)在智能音箱問世以前,傳統藍牙音箱算得上是炙手可熱的影音娛樂單品。當時的藍....
發表于 2022-10-09 09:20?
8785次閱讀
數智化時代,我們每天都在享受科技帶給我們的便利。當你問家里的智能音箱“今天天氣怎么樣”時,智能音箱會....
發表于 2022-09-27 17:07?
1894次閱讀
近日,在上海的人工智能大會上,阿里巴巴集團科技倫理治理委員會正式成立,并提出阿里的六項科技倫理治理準....
發表于 2022-09-08 17:16?
1114次閱讀
1、RT-Thread智能音箱音頻應用實踐
國內智能音箱行業經歷了從百花齊放到三足鼎立的發展階段,阿里、小米、百度...
發表于 2022-09-06 14:32?
1247次閱讀
菁音電子科技(上海)有限公司是專注于音頻芯片的集成電路設計公司,于2015年成立,系中國最大的電子樂....
發表于 2022-09-01 15:23?
223次閱讀
為充分發揮國家綠色數據中心引領帶動作用,推廣先進經驗技術,藍海大腦梳理了部分國家綠色數據中心的先進經....
發表于 2022-08-25 10:56?
1721次閱讀
國際知識發現與數據挖掘大會(以下簡稱KDD)始于1989年,是數據科學領域歷史最悠久、規模最大的頂級....
發表于 2022-08-22 15:32?
1056次閱讀
2022年8月18日,是個好日子,11點58分,籌備了很久的金航標公司阿里巴巴國際站開始上線了。金航....
發表于 2022-08-19 09:39?
431次閱讀
本文介紹使用中微愛芯的5鍵電容式觸摸芯片AIP5905替換以往智能音箱的5路機械按鍵,簡化音箱外觀的....
發表于 2022-08-17 14:06?
332次閱讀
作者|布斯編輯|小沐出品|智哪兒自從智能音箱爆火以來,AI成為了老少皆知的詞匯。一個智能音箱的智能,....
發表于 2022-04-19 09:35?
362次閱讀
智能音箱作為近年來最火爆的硬件風口之一,從誕生之日起,就被寄予“厚望”,科技巨頭希望通過它來搶占智能....
發表于 2022-04-09 10:12?
320次閱讀
智能家居逐漸走進人們的生活,門鎖、掃地機、燈光、窗簾、空調、音箱、中控屏、小家電,總之只要是插電的東....
發表于 2022-03-30 16:40?
345次閱讀
隨著智能化時代的發展,智能家居產品也是越來越普及、越來越大眾化了。要想打造一個完善的智能家庭環境,從....
發表于 2022-03-22 16:47?
365次閱讀
在人工智能的不斷發展的時代,永遠需要性能更高、功耗更低、成本更低的芯片面世。
發表于 2022-03-21 09:23?
315次閱讀
大神們好,我并不是一個電子專業的,想請教大家一個問題,先謝謝各位,我家有兩個只能音箱,一個是天貓精靈,一個是小...
發表于 2022-03-14 19:53?
16730次閱讀
中國杭州,2021 年 12 月 8 日-阿里巴巴集團的數字技術和智能骨干阿里云宣布已開放其專有的物聯網設備全棧技術開...
發表于 2022-03-08 08:50?
2531次閱讀
分享一個不錯的智能音箱靜電保護方案
發表于 2022-01-14 07:46?
1641次閱讀
嘮嘮叨叨的序言——“生命在于折騰”小樹是一名喜歡拆拆卸卸的小伙伴,手里的電子產品恨不得都拆一遍,看看都有啥搗鼓...
發表于 2021-12-31 06:11?
3616次閱讀
小米Sound高保真智能音箱怎么樣?
發表于 2021-12-29 07:38?
1262次閱讀
小米sound智能音箱怎么樣?
發表于 2021-12-29 06:38?
1878次閱讀
// TODO這個月相當于一直在追蹤這個問題, 抽空補充...
發表于 2021-12-21 08:09?
1003次閱讀
小度智能音箱2 紅外版體驗和拆機買的小度智能音箱今天到貨了,哈哈。這個版本支持紅外控制,可以讓家里老家電。之前買...
發表于 2021-09-14 08:47?
1292次閱讀
評論