“這款DDK是基于高通芯片,同時聯合微軟打造的遠場語音交互平臺,是端到端軟硬一體化的智能語音交互開發解決方案……”在高通AWE IoT Day現場,ROOBO儒博的工作人員這樣向前來參觀的客戶介紹其展出的智能語音開發套件。
牽手高通與微軟 智能語音交互開發解決方案MSDDK引發關注
高通AWE IoTDay于3月14、15日在上海浦東嘉里酒店舉辦,期間高通邀請Aquila、thinkstar、quectel、Thundercomm等AI、物聯網相關企業參展。ROOBO儒博作為高通在人工智能領域的合作伙伴受邀參加活動,展示其整合了高通、微軟技術的智能語音交互平臺和視覺交互解決方案。其中智能語音交互開發解決方案MSDDK備受矚目,成為全場關注的焦點。
環型6+1MIC(左)和線性4MIC(右)MSDDK
據悉, MSDDK使用高通SoC平臺,面向不同應用場景分為環型6+1MIC和線性4MIC兩種陣列形式,ROOBO負責該方案在音頻、聲學及硬件的設計與實現,并將其制作成標準方案向全行業推出。微軟提供Speech Service開發平臺,配合Azure提供的認知服務,提供多種語言和知識技能,這也是微軟至今在AI領域提供的第一個開發者硬件平臺。
MSDDK集成全方向喚醒、聲源定位、定向拾音、噪聲消除、回聲抵消、遠場語音識別、語義理解、語音播報等多項技術,可廣泛應用于機器人、會議助理、智能音箱、電視、冰箱、玩具、可穿戴等智能語音產品。
深挖MSDDK技術潛力 ROOBO推出智能會議助理解決方案
在深度挖掘MSDDK技術潛力的基礎上,ROOBO儒博更是推出面向商務會議、培訓教育等小型會議的智能會議助理解決方案與服務,可以滿足多場景辦公需求,幫助客戶有效提升會議辦公效率。
智能會議助理解決方案可實現對不同人的發言進行語音轉寫
智能會議助理解決方案可以同時記錄多人會議的語音和圖像,對不同人的發言進行標記和語音轉寫,分開歸檔提取會議重點議題或摘要。這款產品的應用解決了幾個AI領域的關鍵性技術,讓10米超遠距離拾音、AI智能降噪算法、人聲精確定位、多路聲紋識別、多路語音轉寫等技術成為現實,當前市場上還沒有智能音響或會議輔助設備具備這樣的能力。
在商務會議中,智能會議助理解決方案可以實現360°全向高音質錄音,實時記錄會議的詳細細節,通過先進的AI技術將音頻轉寫為文字,并通過人聲分離和身份識別技術,將發言人與會議內容一一對應,高效整理會議記錄,有效提升工作效率。將此方案應用在教育培訓中,則可以輕松完整地記錄老師、培訓專家的講課內容,擺脫分心記筆記的困擾,通過回顧錄音、文字記錄文件,有效提升學習效率。此外,該解決方案還可應用于媒體采訪、司法取證、醫療會診等場景。除提供端到端會議解決方案外,ROOBO儒博還支持語音糾錯、數據標注、AI場景定制等系列平臺服務。
據了解,ROOBO儒博在2018年12月18日與微軟簽署人工智能產業戰略合作備忘錄,雙方表示將充分發揮各自技術優勢,在人工智能與云計算領域進一步展開研究與合作,共同推進人工智能產業互聯網生態體系的建設。我們有理由相信,與高通和微軟建立起深度合作,并且擁有優質硬件開發、平臺服務、行業解決方案設計、數據處理能力的ROOBO儒博,具備成長為AI行業獨角獸的潛力。
-
語音識別
+關注
關注
38文章
1739瀏覽量
112636 -
智能音箱
+關注
關注
31文章
1783瀏覽量
78568
發布評論請先 登錄
相關推薦
評論