01技術篇
DUI平臺,走向定制規模化之路
2017年9月,思必馳,在多年智能語音技術基礎上,以Dialogue為核心,結合GUI和VUI,自主研發了全鏈路智能對話定制平臺——DUI,為開發者提供高可用定制的人機對話技術服務,為智能終端開發者提供核心交互能力,協助傳統設備實現智能升級。
DUI致力構建以場景服務為基礎,以用戶為中心的自由人機交互體驗,支持自由調用圖文、列表、音樂、內嵌網頁等多種控件,提供從喚醒、語音識別、語義理解到對話管理、內容輸出、TTS播報的全鏈路技術的超高度定制。DUI還擁有優秀的大數據平臺和產品運營中心,幫助開發者快速優化產品;秒級在線熱更新,用戶體驗更流暢。DUI平臺將賦能智能終端、APP端、網頁端、微信端等多種終端,讓更多產品能夠快速接入語音功能。
八大技術升級,打造更人性化的對話交互
1. 推出聲紋識別方案
基于喚醒的聲紋認證,提供更安全的身份保障和個性化體驗。聲紋識別包括說話人辨識(Speaker Identification,簡稱SI,一對N的關系)和說話人確認(Speaker Verification,簡稱 SV,一對一的關系)。思必馳聲紋識別方案,基于單麥的純軟算法,集內準確率在95%以上,能夠被應用于聲紋開鎖、語音支付、個性化推薦、安防認證等場景。
2. 推出雙麥陣列方案
雙波束動態噪聲抑制和回聲消除,支持平面180度遠場拾音,有效提升語音交互體驗。思必馳雙麥陣列方案,可廣泛應用于車載和家居場景下的中遠場交互,在噪音環境中也有不錯的喚醒和識別理解能力,是一個超高性價比的軟硬一體化解決方案。
3. 語音喚醒升級
設備喚醒的高靈敏,容易觸發更多的誤喚醒。用戶在聊天或者看電視的時候,就常常遇到旁邊的智能音箱突然被喚醒,被“插話”,讓用戶不勝其煩。此前,大部分產品能達到2次/24小時的誤喚醒率已經算是不錯的水平。而思必馳最新的技術優化后,在維持超高喚醒率的同時,誤喚醒相對降低60%,500h+實測,每48小時誤喚醒僅一次。
4. 推出TTS快速定制方案
思必馳小數據快速定制TTS,在傳統的HMM訓練后得到源發音人的模型參數,將原始模型的mixture component聚類成若干類,利用MLLR和目標發音人的數據求取源發音人到目標發音人的轉換模型。僅需提供5-10分鐘音頻素材,經過機器的模型訓練,即可合成聲音,讓任意文本都可秒變成用戶的聲音。
5. 語音識別魯棒性能力提高
噪聲環境下的語音識別一直以來是一個難題。在面對真實環境下的多類別強噪聲情況環境(比如車載噪聲、家居遠場回聲等),識別性能有所受影響。思必馳VDCNN算法,在噪聲環境語音識別的業界基準庫Aurora4上,取得了7.09%的詞錯誤率,在降噪處理上表現出不可取代的優勢,在強干擾和強混響的真實環境中,識別率相對以往提高20%。
6. 上線語言模型定制功能
通用的模型無法滿足開發者的多樣化需求。在應用場景中,內容資源、語言模型與語義需要三者配合好。對于像“MC子龍”類的特定詞匯,添加到詞庫或說法里,會作為語料用于訓練識別語言模型和語義解析模型,通過思必馳 DUI平臺釋放的技術服務,即可準確識別。解碼資源實施同步,最快秒級完成熱更新,實現無感知的交互體驗升級。
7. NLU能力升級
結合上下文的對話理解和對話管理技術提供了更加靈活的對話交互和更精細的場景劃分,支持可隨時打斷、智能糾錯的多輪對話和漸進式上下文理解。通過增強實體識別、實體關系抽取和大規模知識圖譜應用,促進機器學習和知識庫技術深度融合,使得意圖識別能力顯著提高10%。同時與第三方內容服務深度耦合,打造更實用的人機交互體驗。
8. 對話能力升級
以任務型對話為核心,兼具閑聊、問答與命令對話,引入知識圖譜,實體概念,維基百科等形式,打造基于GUI+VUI的多模交互,實現“語音+觸控”的完美結合。思必馳DUI所集成的核心智能對話技術具有超高度可定制性,實現了從本地端設備到云端服務,從識別到合成,從語義領域到對話邏輯,從技術模塊到內容資源的全方位定制支持。
AIOS智能車載技術方案
思必馳于2015年10月推出了AIOS for Car對話操作系統,2017年初,該方案升級至AIOS3.3版本,新增十一大功能:one-shot一把說、離線導航功能、偏好導航功能、導航中的快捷交互、隨意打斷/搶說、合成音切換、音樂中的快捷交互、聽歌識曲、微信及微信地圖接人、自定義喚醒詞、路況及限行查詢。目前,該方案已廣泛應用于當前的車載后裝市場,為用戶的駕乘生活帶來更流暢的交互體驗。后期,AIOS將與DUI無縫融合,性能不變,體驗升級。
針對遠場交互的麥克風陣列方案
遠場交互和魯棒性是近兩年的智能硬件剛需,尤其是在家居環境下的3~5米遠場交互,和車載環境下的近場復雜噪音環境下。2017年,思必馳推出了多款麥克風陣列方案:
環形6麥方案:支持5米遠場交互和360°全角度拾音,±10°聲源定位,適用于智能音箱、家居中控等智能硬件產品。
線性4麥方案:支持5米遠場交互和180°拾音,適用于智能電視、智能冰箱、智能空調等位置相對固定的智能硬件產品。
雙麥方案:適用于家居和車載環境里的中遠場交互,擁有極好的降噪處理能力,適合輕需求的智能音箱、智能后視鏡等。
智能機器人/故事機技術方案
智能機器人/故事機市場無疑是今年的一大熱點,在前端語音處理上,思必馳的麥克風陣列方案解決了遠場環境下的痛點。思必馳憑借著強大的語音交互能力、領先的TTS播報、海量的聚類資源、強有力的AI內芯快速拓展了市場,同時,思必馳已積累數十個領域的自建資源庫、并與眾多第三方知名內容達成戰略合作。自建資源的豐富累積,讓機器人/ 故事機更聰明!
02市場合作篇
目前思必馳已與眾多業界知名公司達成合作,包括阿里、騰訊、小米、富士康、聯想、360、海爾、浙江大華等,在智能硬件泛物聯網領域打造了多款行業爆品。數億用戶通過思必馳自然語言交互,實現與智能終端的互動交流。
2017年,思必馳在智能車載、智能家居、智能機器人/故事機領域的合作全面突破,收獲頗豐。
智能車載:暢享自由駕駛
思必馳攜手合作伙伴,打造了小米板牙70邁智能后視鏡、車蘿卜HUD、捷渡遠界智能后視鏡一二三代、掌訊車機(方案商)等多品類產品。截止目前,思必馳在智能車載后裝市場占有率約達60%,穩居行業第一,智能后視鏡領域達70%,智能HUD領域達80%。
智能家居:樂享智慧生活
在今年機器火爆的智能音箱市場,AISpeech Inside出貨量行業第一,天貓精靈X1、小米小愛同學、聯想智能音箱、小米互聯網音箱等產品均采用了思必馳語音技術方案,其中天貓精靈雙十一賣出100+萬臺,小米小愛同學開售23秒售罄,備受市場追捧。
除智能音箱外,思必馳攜手合作伙伴打造了聯想智能電視、諸葛小明智能臺燈、小米藍牙語音遙控器、海爾馨廚冰箱等多款多類目家居產品,讓智能語音走進千家萬戶。
智能機器人/故事機:感受萌動心聲
兒童機器人/故事機市場今年尤為火熱,在這一領域,目前思必馳品牌覆蓋率行業第一, 打造了夏普曉樂、水果兔故事機、火火兔平板、牛聽聽故事機、小蘿卜兒童機器人、貝貝禮兒童故事機等多款產品,激活兒童故事機市場。這些產品的銷量在行業內遙遙領先。
03團隊篇
思必馳總部在蘇州,并在深圳設立商務辦事處,在北京設立研發院和市場部,在上海與上海交通大學設立了基礎研究中心(聯合實驗室)。目前,思必馳團隊400余人,其中近一半為研發工程師,大都來自國內外知名的高校和研究院所,如劍橋大學、香港科技大學、新加坡國立大學、以色列理工、清華、北大、上海交大、中科院及中科大等等,核心研發團隊成員全部為本科及其以上學歷,其中碩士比例約占60%,博士占比約為20%。同時,思必馳也匯聚了來自阿里、騰訊、百度、樂視、英特爾、華為、滴滴等行業巨頭的資深專家。
2017年思必馳迎來了多位大咖的加盟。初敏博士,2017年9月加入思必馳,任思必馳副總裁,北京研發院院長,負責技術的新場景探索和業務落地。趙恒藝,2017年1月加入思必馳,任思必馳副總裁、DUI平臺總經理,負責DUI平臺項目整體運營和發展。此外,來自聯想之星、PPTV、明道數據等多位行業大咖加入思必馳,攜手前行,共探發展。
04榮譽篇
2017年在榮耀的聚光燈下,我們受到了極大的關注!
2017年4月,CCTV-2《經濟半小時》以30分鐘篇幅全方面報道了關于思必馳的產學研一體化發展之路(CCTV-2《經濟半小時》:看思必馳的披荊斬棘之路)。
2017年9月,CCTV-1《機智過人》展現思必馳語音合成技術(CCTV-1《機智過人》小馳一展歌喉,這是你不知道的歌聲合成!)。
2017年11月,CCTV-1《機智過人》展現思必馳聲紋識別技術(聲紋識別 |“小思”PK霍尊辨識小青衣,這是來自人工智能的暴擊!)。
同時,思必馳入選了Gartner“2017東亞五大明星AI創業公司”,并再度被高盛評為“全球人工智能關鍵參與者”。2017年,思必馳斬獲了大大小小近百項榮譽。
05打造AI生態
未來,思必馳將繼續加速在物聯網領域的深入和拓展,整體布局,打造AI生態,賦能萬物。
完善AI產業鏈布局
在整體生態方面,針對AI領域,思必馳于2016年成立馳星創投,得到了元禾資本、富士康、清華控股等LP的支持,旗下擁有兩支基金,分別為2億元天使基金和10億元成長基金,專注投資人工智能和智能交互產業早期項目。思必馳對AI領域的關注并不僅局限在人工智能物聯網上下游產業鏈,也關注傳統行業,促進傳統行業的快速轉型,例如擴展到了教育、醫療等。思必馳產業基金已成功孵化并投資了車蘿卜、慧聲、先聲教育、AITEK、SIGMOID、愛醫聲、RT-Thread等9家企業。
推進AI產業化進程
思必馳著力推進AI產業化的進程。2017年9月推出的DUI開放平臺,將對話技術賦能給更多智能終端,推進語音技術的規?;瘧谩M?,阿里原iDST語音負責人初敏博士加入思必馳成立北京研發院,以針對企業的主動交互式智能服務為切入點,推動AI產業化的進程!
專注源頭技術創新與發展
思必馳是AI技術型企業,思必馳堅信,技術型企業的真正比拼并不在萬眾矚目的聚光燈下,技術軟硬實力才是長久之策。未來,依托蘇州研發總部、北京研發院、蘇州人工智能研究院的基礎性研究和應用性探索,思必馳將不斷拓展智能語音的應用場景和領域,帶動AI語音技術的推陳出新,賦能更多智能終端產品,推動傳統行業轉型,讓語音近在咫尺,走進未來智能生活。
2018 我們,攜手同行!
-
人工智能
+關注
關注
1791文章
47183瀏覽量
238266 -
語音交互
+關注
關注
3文章
286瀏覽量
28002 -
思必馳
+關注
關注
4文章
284瀏覽量
14282
發布評論請先 登錄
相關推薦
評論