色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何使用音頻來估計與講話用戶之間的距離,并識別周圍的聲音

倩倩 ? 來源:百度粉絲網 ? 作者:百度粉絲網 ? 2021-01-22 16:32 ? 次閱讀

最新研究表明,蘋果公司正在研究HomePod或其他設備如何使用音頻來估計與講話用戶之間的距離,并識別周圍的聲音。

Apple的HomePod已經非常擅長于聽到您的聲音,即使它正在大聲播放音樂。蘋果公司有兩項單獨的新專利申請表明,蘋果公司希望將其改進,并將設備的聆聽能力提高到一個新水平。

其中之一,“基于學習的距離估計”,不僅涉及使用音頻來識別用戶,而且要弄清楚他們在哪里。

專利申請說:“通常希望設備使用[其]緊湊型麥克風陣列來估算從設備到用戶的距離。” “例如,該設備可以基于用戶到該設備的估計距離來調整播放音量或來自智能輔助設備的響應。”

繼續說:“因此,如果用戶離設備非常近,則不會大量播放音樂或語音?!?或者,如果用戶離得很遠,則可以將媒體播放或來自智能助手設備的響應調整為更大的音量?!?/p>

同樣的想法也意味著將其引入蘋果公司目前令人印象深刻但有些瑕疵的系統,在該系統中,所有設備都會嘗試確定您對“嘿,Siri”說的是什么。

蘋果公司說:“在有多個設備的應用程序中,這些設備可以在彼此之間進行協調或仲裁,以根據從每個設備到用戶的距離來決定應回答一個或多個設備的查詢?!?/p>

蘋果公司提出了簡單和更復雜的解決方案,它們都可以同時使用。更簡單的方法是讓設備先執行HomePod的工作并首先繪制其環境圖。

然后,它實際上具有“在聲學環境中的測量點或模擬點的網格”。在這種情況下,可以將聲音與此“網格”進行比較,以大致了解說話者所在的位置。

但是,Apple認為這本身并不足夠好,并且還說它與Siri最少一起使用。那是因為一個人說話時可能會動彈,而且他們要求快速回應-此提議不適合。

備選地,然后,“如果至少兩個麥克風陣列可用”,則“可以使用三角測量方法來估計語音源的距離”。

但是,這里的關鍵部分是至少需要兩個帶麥克風的設備。因此,Apple提供了另一個涉及更多的解決方案,其中涉及“基于學習的系統,如深度神經網絡(DNN)”,并且不需要多個設備。

專利申請說:“深度學習系統可以根據緊湊型麥克風陣列接收到的語音信號來估計每個時間幀的語音源距離?!?/p>

這個DNN系統可以做的是確定什么是語音,什么是背景噪聲。然后,它可以計算“有關直接信號傳播的信息”以及“混響效果和噪聲”。

該申請歸功于三位發明者,包括Mehrez Souden和Joshua D. Atkins。他們先前的相關工作包括已獲專利的如何使用比普通麥克風少的聲音來錄制完整空間聲音的專利。

這特別涉及Apple AR中的音頻,該最新專利申請涉及真實環境中的物理設備。但是,如果只是為了避免用太大聲的HomePod mini炸毀別人的耳朵而感到很麻煩,那還有很多事情要做。

該專利申請說:“例如,助聽器之類的輔助和增強型助聽器可以根據語音源的距離來增強音頻信號。”

這也是第二個新公開的專利申請重點關注的內容。

識別重要的聲音

“基于觀察到的聲音識別聲源的系統和方法”,是關于讓一些設備識別其他聲音并為我們做出反應。

“許多家用電器,例如微波爐,洗衣機,洗碗機和門鈴,會發出聲音來提醒用戶該器具的狀況已經改變,”該專利申請開始。

它繼續說:“但是,由于各種原因,用戶可能無法聽到家用電器發出的聲音警報?!?“例如,用戶可能有聽力障礙,用戶可能在外面或在另一個房間里,或者設備可能發出被家庭聲學場景遮擋的聲音。”

也不必是您的煮蛋計時器關閉。該專利同樣涉及“公共場所(政府大樓),半公共場所(辦公室大廳)和私人場所(住宅或辦公大樓)”中的聲音。

它說:“(這些)也有聲學場景,可以包含帶有信息的聲音。” “例如,鈴,鈴或蜂鳴器可能指示門已經打開或關閉,或者警報器可能發出警報聲或其他聲音,警告附近的人有危險(例如,煙,火或一氧化碳)。”

總體而言,該專利申請主要詳述了可以“訓練”設備以識別“常見聲音”的方法。然后,它將繼續偵聽其中的任何一個,并且當聽到一個聲音時,可以發出“響應于確定聲音存在于聲學場景中的選定輸出”。

換句話說,如果是您的煮蛋計時器關閉,則該設備可能會使您的Apple Watch在手腕上輕按?;蛘?,如果是防盜警報,則該設備可以通知當局。

蘋果公司表示:“聲音中包含大量的上下文信息?!?“識別常見的聲音可以使電子設備響應于觀察到的環境(例如,根據觀察到的聲音確定)來適應其行為或提供服務,從而增加它們對用戶的相關性和價值,同時需要更少的用戶幫助或輸入?!?/p>

第二項專利申請歸功于包括丹尼爾·克林格(Daniel C. Klinger)在內的四位發明家。他先前的工作包括一項專利申請,該專利用于通過HomePod或其他設備進行安全的電話呼叫。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 音頻
    +關注

    關注

    29

    文章

    2869

    瀏覽量

    81496
  • 蘋果公司
    +關注

    關注

    2

    文章

    447

    瀏覽量

    22592
  • 深度學習
    +關注

    關注

    73

    文章

    5500

    瀏覽量

    121113
收藏 人收藏

    評論

    相關推薦

    TIKOOL太酷信息無線內部通話系統允許多個人一起講話,頻道內會不會很吵?

    傳統的對講機聲音采樣率普遍是4K,音質差,往往音量大但稍有干擾就聽不清內容;TIKOOL太酷無線內部通話系統音頻采樣率可達16K,音質數倍的提升,具備極高的聲音還原度,如同面對面聊天,多人講話
    發表于 12-18 09:07

    TLV320aic3104怎么設置使耳機能聽到人講話聲音?

    我公司有項目正在使用TLV320AIC3104 這顆TI codec IC,已拿到這顆IC的開發套件,但是現在用TLV320aic3104評估板有些問題請教。從電腦里面輸出聲音,耳機能正常收聽。但是還不知道怎么設置使耳機能聽到人講話
    發表于 11-07 06:44

    8127+tlv320aic3104設置立體聲采集到音頻播放是快進音頻聲音,怎么解決?

    8127+tlv320aic3104設置單通道采集到的音頻播放正常流暢的聲音,設置立體聲采集到音頻 播放出來是快進音頻聲音就是
    發表于 11-05 06:31

    用PCM1804做音頻轉換,輸出聲音很難聽是什么原因導致的?

    。 目前還不確定問題在哪里,就TTS和PCM之間檢測,有幾個可能,TTS輸出到PCM的信號需要調制到2.5V的中心電壓(已測試,無效果);TTS輸出到PCM的聲音信號峰值需放到2.5V。PCM
    發表于 10-28 08:01

    FSA8049連接耳麥L/R輸出聲音正常,耳麥話筒講話聲音沒有從FSA8049_B1腳輸出來是為什么?

    請工程幫忙確認一下圖中FSA8049連接是否正確,現在遇到的問題是連接耳麥L/R輸出聲音正常,耳麥話筒講話聲音沒有從FSA8049_B1腳輸出來,測量B1腳MIC_BIAS電壓2.5v正常,B3腳連接耳麥正極就沒有電壓。
    發表于 10-25 11:07

    音頻信號通常包括哪些聲音信號

    音頻信號是指通過聲音傳輸的信號,它包含了各種不同的聲音信號。以下是對音頻信號中常見的聲音信號的介紹: 語音信號 語音信號是人類通過聲帶振動產
    的頭像 發表于 08-25 15:43 ?1229次閱讀

    用opa1671做麥克風前置放大器做音頻ADC采樣時,距離聲音太小怎么解決?

    在用opa1671做麥克風前置放大器做音頻ADC采樣時,距離聲音太小,距離聲音太大,有沒有推薦的自動AGC電路(參考電路),(由于功耗
    發表于 08-08 08:23

    TEA2025立體聲音頻功率放大器原理是什么

    音頻設備設計中,功率放大器是實現高質量音頻輸出的關鍵組件。TEA2025立體聲音頻功率放大器以其杰出的性能和穩定性,成為音頻工程師的理想選擇。本文將詳細介紹TEA2025立體
    的頭像 發表于 06-11 17:23 ?702次閱讀

    基于深度學習的鳥類聲音識別系統

    模型被用于對鳥類聲音數據進行高精度的分類。然而,現有的大多數鳥類聲音識別模型的泛化能力較差,并且采用復雜的算法提取鳥類聲音特征。為了解決這
    發表于 05-30 20:30

    谷歌增強安卓無障礙體驗:用AI描述周圍環境等

     據悉,Lookout是谷歌專為盲人與低視力Android用戶設計的應用,旨在協助他們識別周邊環境閱讀文檔。此次升級后,Lookout新增了一種查找模式,可識別包括座椅、桌子等在內的
    的頭像 發表于 05-17 10:18 ?403次閱讀

    【RTC程序設計:實時音視頻權威指南】音頻采集與渲染

    在進行視頻的采集與渲染的同時,我們還需要對音頻進行實時的采集和渲染。對于rtc來說,音頻的實時性和流暢性更加重要。 聲音是由于物體在空氣中振動而產生的壓力波,聲波的存在依賴于空氣介質,那么聲音
    發表于 04-28 21:00

    蘋果獲家庭聲音定位和識別專利,HomePod可監聽嬰兒哭鬧并向用戶

    據美國商標與專利管理局最近公布信息,蘋果成功取得一項關于音頻的專利,透過監測室內響動,為用戶提供另一間房內事件詳情。該專利名為《家庭聲音定位及辨識》
    的頭像 發表于 02-28 11:41 ?776次閱讀

    如何將HC-SR04連接到Arduino編寫一個簡單的程序測量距離

    一種流行的Arduino超聲波傳感器是HC-SR04。它廣泛用于非接觸式距離測量,通常用于機器人和自動化項目。本指南將向您展示如何將HC-SR04連接到Arduino編寫一個簡單的程序測量
    的頭像 發表于 02-11 10:17 ?2334次閱讀
    如何將HC-SR04連接到Arduino<b class='flag-5'>并</b>編寫一個簡單的程序<b class='flag-5'>來</b>測量<b class='flag-5'>距離</b>

    立體聲音頻放大器電路圖分享

    立體聲音頻放大器是一種專門設計用于處理立體聲音頻信號的放大器。它通常具有兩個獨立的放大通道,分別用于處理左聲道和右聲道的音頻信號。立體聲音頻放大器的主要目的是增強
    的頭像 發表于 02-06 14:45 ?2627次閱讀
    立體<b class='flag-5'>聲音頻</b>放大器電路圖分享

    labview聲音采集與處理

    ,LabVIEW提供了豐富的聲音采集工具。用戶可以通過聲卡或其他外部設備將聲音信號輸入電腦。LabVIEW支持多種聲音輸入接口,包括麥克風、音頻
    的頭像 發表于 01-04 10:48 ?2353次閱讀
    主站蜘蛛池模板: 亚洲精品无码葡京AV天堂| 国产亚洲AV无码成人网站| 日韩中文网| 精品国产麻豆免费人成网站| yellow在线观看免费观看大全| 亚洲精品m在线观看| 披黑人猛躁10次高潮| 久久精品手机观看| 国产精品嫩草影院在线观看免费| 9966在线观看免费高清电影| 亚洲乱码中文字幕久久孕妇黑人| 色噜噜噜亚洲男人的天堂| 美女搞鸡网站| 久久黄视频| 国产一级做a爰片久久毛片男| 白丝美女被狂躁免费漫画| 中国拍三a级的明星女| 亚洲大片免费看| 双手绑在床头调教乳尖| 日本精品久久无码影院| 牢记永久免费网址| 久久re这里精品23| 狠狠色噜噜狠狠狠狠米奇777| 国产精品第1页在线观看| 成人 迅雷下载| xfplay 无码专区 亚洲| 99久久国产露脸国语对白| 777米奇影院第七色色| 中国女人精69xxxxxx视频| 永久免费精品影视网站| 亚洲性夜色噜噜噜网站2258KK| 午夜伦4480yy妇女久久| 文中字幕一区二区三区视频播放 | 成人免费观看www视频| 99pao成人国产永久免费视频| 在线高清视频不卡无码| 夜夜躁日日躁狠狠| 亚洲综合日韩中文字幕v在线| 亚洲精品有码在线观看| 亚洲欧洲一级| 亚洲中文字幕乱码熟女在线|