天天色综合2,在线播放葵千惠激烈潮催,这里有精品可以观看

如果您曾經使用過虛擬助手，您可能會認為您正在與一臺非常智能的設備交談，它幾乎可以回答您提出的任何問題。嗯，實際上，Amazon Echos、Google Homes 和其他類似的設備通常不知道你在說什么。

是的，這些設備利用了人工智能。但不是你期望的那樣。端點硬件通常會簡單地檢測到喚醒詞或觸發短語并打開與自然語言處理引擎分析請求的云的連接。在許多情況下，他們不只是傳輸您的問題的記錄。

“我們將其稱為邊緣的‘弱喚醒詞’，”加利福尼亞州帕洛阿爾托的 Knowles Intelligent Audio 物聯網營銷高級總監 Vikram Shrivastava 說。“你仍然需要將整個錄音發送到云端，以獲得真正可靠的第二秒，即有人真正說‘好吧，谷歌’或有人真正說出了相關的觸發詞。

“這將產生我們稱之為檢測和錯誤接受的真陽性率（TPR），”他繼續說道。“所以，如果你沒有說 Alexa，但它還是向云端發送了一條消息，那么云端就會說，‘不，你沒有。我仔細檢查過，你錯了。那是因為邊緣設備的邊緣檢測算法不夠復雜。”

換句話說，許多虛擬助手至少會訪問云端兩次：一次是為了驗證他們是否被尋址，第二次是為了響應請求。

沒那么聰明吧？

邊緣對話

這種架構有幾個缺點。將請求發送到云會增加時間和成本，還會使潛在的敏感數據面臨安全和隱私威脅。但這種方法的最大限制因素是打開和維護這些網絡連接會消耗能量，這會阻止語音 AI 部署在所有電池供電的產品中。

挑戰就在這里。許多邊緣設備使用的節能技術不具備在本地運行 AI 的性能，因此必須將語音命令發送到云端，這會招致前面提到的懲罰。為了擺脫這個循環，Knowles 和其他地方的音頻工程師正在將數字信號處理器（DSP）的傳統效率與新興的神經網絡算法相結合，以提高邊緣智能。

“我們現在看到的是邊緣設備開始向內置生態系統過渡，”Shrivastava 解釋說。“所以現在你可以擁有多達 10、20、30 條命令，這些命令都可以在邊緣本身執行。

“一些觸發詞改進顯著改善了邊緣的 TPR，”他繼續說道。“音頻 DSP 實際上發揮了重要作用，而邊緣的音頻算法發揮了重要作用，這只是在嘈雜環境中檢測這些觸發詞的性能。因此，如果我的真空吸塵器正在運行并且我正在嘗試發出命令，或者您在廚房并且排氣扇正在運行并且您正在嘗試與您的 Alexa 設備交談。

“這就是我們所說的低信噪比，這意味著你所處的環境中的噪音非常高，平均談話會低于平均噪音。”

Knowles 是一家無晶圓半導體公司，以其高端麥克風和最近的音頻處理解決方案而聞名。后者始于 2015 年 Knowles 收購 Audience Inc.，該公司成立于計算聽覺場景分析（CASA）的學術研究，研究人類如何對與其他頻率混合的聲音進行分組和區分。這項研究導致專門的音頻處理器能夠以 Shrivastava 描述的方式從背景噪聲中提取一個清晰的語音信號。

除了這些音頻處理器之外，Knowles AISonic 音頻邊緣處理器等產品還集成了來自 Cadence Design Systems 的 DSP IP 內核。Cadence 的 Tensilica HiFi 音頻 DSP 產品組合因其高能效和高效數字前端和神經網絡處理能力而在智能邊緣語音應用中廣受歡迎。

圖 1. Knowles 將 Cadence Tensilica HiFi DSP 內核集成到其 AISonic 音頻邊緣處理器中。

Knowles 將這些基于 Tensilica 的音頻處理解決方案部署到從單麥克風 AISonic SmartMics 到高端設備（如高端 Honeywell 或 Nest 級恒溫器）的所有設備中，它們可以管理三到七個麥克風。

“麥克風是數字的，DSP 是數字的，DSP 和主處理器之間的通信也是數字的，”Shrivastava 說。“我們就說它是一個 Ecobee 設備。那里有一個基于 Arm 的主機處理器，它運行一個小的 Alexa 堆棧，它將接受來自 Knowles 子系統的命令短語。

“我們可以接收核心麥克風數據，我們可以進行波束成形，我們可以找出你在哪個方向說話，我們可以只改善和放大來自那個方向的信號，忽略來自另一個方向的噪聲，做一些其他噪聲抑制也是如此，然后準確地檢測到觸發詞，”他繼續說道。“在一個經過良好調整的系統中，我們在 24 小時內會出現少于三個錯誤檢測。我們可以在 1 MB 的內存中完成這一切。

“擁有所有這些背后的價值主張，只是為了給你一個想法，如果你需要一個運行在 1 GHz 的 Arm 內核來進行語音處理，我們將在我們的 DSP 上以大約 50 MHz 運行相同的進程，所以幾乎是 20 倍，”Knowles 工程師解釋道。“這直接轉化為功耗。”

顯然，Tensilica 核心無法提供 Shrivastava 所描述的開箱即用的效率水平。應用工程師必須針對最終用例調整系統。對于 Cadence Tensilica 客戶，此過程因定制說明的可用性而得到簡化。

“Tensilica 的獨特之處之一是能夠使用 Tensilica 指令擴展或 TIE，”Cadence 產品營銷總監、Knowles 前員工 Adam Abed 說。“Knowles 廣泛使用它來定制和構建非常高效的浮點處理。

“因此，我們共同打造了這款非常出色、獨特的產品，它不僅能夠從 MEMS 和麥克風的角度提供高質量的音頻，而且還可以在不醒來的情況下以超低功耗的方式進行清理或語音觸發等操作系統的大部分內容，”他補充道（圖 2）。

圖 2. Cadence 的 Tensilica HiFi 系列 DSP 提供性能可擴展性和指令定制，以滿足一系列智能語音處理系統的要求。

為了最大限度地提高電源效率和 AI 性能，Abed 提到的喚醒過程通常根據系統分階段實施。正如他的同事、Cadence 產品工程總監劉一鵬所解釋的那樣，像 HiFi 5 這樣的 IP 需要“結合傳統 DSP 以及處理神經網絡本身的能力。

“第一層是檢測是否真的有聲音，所以這是一個非常輕量級的語音活動檢測，”劉說。“如果它檢測到語音，那么您就會喚醒下一層處理，稱為關鍵字識別。這可以是非常輕量級的處理。它只是說，‘我聽到了一個聽起來像我正在聽的詞。’”

“然后是第三層，一旦你檢測到一個觸發詞，你可能想要喚醒另一個處理層來驗證，‘是的，我確實聽到了我認為我聽到的內容。這實際上是一個非常重的處理負載，”她繼續說道，“從那里你繼續聽，這變成了一個重負載的神經網絡處理。

“它可能需要 1 MHz，也可能需要 50 MHz。這真的取決于。”

選擇最佳語音 AI 堆棧：“視情況而定”

當談到 AI 和 ML 技術評估時，這真的取決于。

當然，確定智能音頻系統的多少兆赫、多少功耗、關鍵字檢測準確度等關鍵性能指標因設計而異。Liu 繼續解釋說，這種多樣性使得評估智能語音系統組件甚至 DSP 的可行性變得困難，因為在處理高度專業化的 DSP 時，每秒萬億次操作（TOPS）等指標“實際上并不重要”。

“你可以做 1000 TOPS，但所有的操作都是錯誤的類型。但是您可能只需要 200 MHz 來進行某些類型的處理。或者，如果您編寫說明并且一臺設備需要 50 MHz 而不是 200 MHz，即使它們具有相同數量的頂部，本質上您擁有更有效的頂部，”她補充道。

不過，最近，MLCommons 已經通過與 EEMBC 合作開發一個新的系統級基準測試來簡化評估邊緣 AI 組件的過程：MLPerf Tiny Inference。作為 ML Commons 從云到邊緣的一系列訓練和推理基準中的最新版本，MLPerf Tiny Inference 目前為四個用例提供了標準框架和參考實現：關鍵字定位、視覺喚醒詞、圖像分類和異常檢測。

MLPerf Tiny 工作負載是圍繞預先訓練的 32 位浮點參考模型（FP32）設計的，哈佛大學邊緣計算實驗室的博士生兼 MLPerf Tiny 推理工作組聯合主席 Colby Banbury 將其識別為當前的“準確性的黃金標準”。但是，MLPerf Tiny Inference 也提供了一個量化的 8 位整數模型（INT-8）。

MLPerf Tiny 作為系統級基準的不同之處在于它的靈活性，它有助于避免對計算性能進行單點性能評估，例如，允許組織提交 ML 堆棧中的任何組件。這包括編譯器、框架或其他任何東西。

但是對于基準測試而言，過于靈活可能是不利的，因為您很快就會得到多個不相關的向量。MLPerf Tiny 通過兩個不同的部門（開放式和封閉式）解決了這個問題，它們為提交者和用戶提供了針對特定目的或相互衡量 ML 技術的能力。

“MLPerf 通常有這么多規則。它源于靈活性和可比性之間的基準測試中這種不斷拉動的因素，”班伯里說。“封閉式基準更具可比性。您采用預先訓練的模型，然后您可以根據已概述的某些特定規則以與參考模型等效的方式將其實施到您的硬件上。所以這實際上是硬件平臺的一對一比較。”

“但 Tiny ML 的前景需要如此高的效率，因此許多軟件供應商甚至硬件供應商都在堆棧中的所有不同點提供價值，”MLPerf Tiny 聯合主席繼續說道。“因此，為了讓人們能夠證明他們有更好的模型設計，或者他們可能能夠在訓練階段提供更好的數據增強，甚至是不同類型的量化，開放式劃分允許你基本上只解決以任何你想要的方式。我們測量準確性、延遲和可選的能量，因此您可以達到產品預期的任何優化點。”

簡而言之，封閉部分允許用戶根據特定特征評估 ML 組件，而開放部分可用于測量解決方案的一部分或全部。在開放分區中，可以修改模型、訓練腳本、數據集和參考實現的其他部分以適應提交要求。

使用經典信號處理清晰聆聽

但回到聲音。音頻 AI 的最終目標是能夠完全在邊緣執行成熟的自然語言處理（NLP）。當然，這需要比當今市場準備的更多的處理能力、更多的內存、更多的功率和更多的成本。

“我想說，我們距離真正的自然語言邊緣還有兩年的時間，”Knowles 的 Shrivastava 說。“我們現在看到成功的地方是低功耗、基于電池的設備，這些設備希望增加語音和語音處理功能。因此，擁有其中一些本地命令或內置功能。

“現在還處于早期階段，因為你需要大量資源來理解邊緣的自然語言，而這仍然是云的領域，”他繼續說道。“在過去的五年里，我們仍然沒有看到很多自然語言來到邊緣。但肯定的是，我們正在將特定于上下文的命令的子集移向邊緣。而且我認為我們會看到越來越多的這些命令，因為它們適合某些嵌入式流程。

正在開發的 AI 處理引擎有望更有效地執行語音激活、識別和關鍵字定位，并在邊緣支持更高級、基于自然語言的工作負載。事實上，Knowles 和 Cadence 都在積極開發此類解決方案。

但在中短期內，仍然需要實時做出語音觸發驗證等本地決策，同時消耗更少的電量。因此，憑借其對流數據進行高效浮點處理的傳統，為什么不嘗試將傳統 DSP 用于新穎的新應用呢？

審核編輯：郭婷

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

dsp

dsp

+關注

關注
554

文章
8059

瀏覽量
349863
嵌入式

嵌入式

+關注

關注
5090

文章
19176

瀏覽量
306886
AI

AI

+關注

關注
87

文章
31490

瀏覽量
269883

5g邊緣智能網關是什么

5G邊緣智能網關是一款集成了前沿科技的產品，它集5G、邊緣計算、通信管理、本地可視化等多種技術于一體，是5G網絡架構中的關鍵組件，也是連接物理世界與數字世界的重要橋梁。以下是對5G邊緣

發表于 01-14 09:09 ?158次閱讀

什么是邊緣計算網關？可以實現什么功能？

邊緣計算網關是一種智能設備，通常部署在網絡的邊緣位置，靠近數據源或用戶。它負責在本地處理和分析數據，執行數據采集、傳輸、存儲和通信等功能。邊緣計算網關能夠將傳統設備與云端連接，使得數據

發表于 01-09 17:41 ?202次閱讀

什么是<b class='flag-5'>邊緣</b>計算網關？可以實現什么功能？

能在DSP的存儲器上存MP3或其他格式的音頻文件，由DSP讀后控制TLV320AIC23轉換成語音？

我想用TLV320AIC23和DSP做一個音頻系統。我想問一下能在DSP的存儲器上存MP3或其他格式的音頻文件，由DSP讀后控制TLV320AIC23轉換成語音？有沒有好的方案推薦謝

發表于 11-01 06:45

Sitara Linux ALSA DSP麥克風陣列語音識別

電子發燒友網站提供《Sitara Linux ALSA DSP麥克風陣列語音識別.pdf》資料免費下載

發表于 10-10 09:13 ?0次下載

Sitara Linux ALSA <b class='flag-5'>DSP</b>麥克風陣列<b class='flag-5'>語音</b>識別

基于 DSP5509 進行數字圖像處理中 Sobel 算子邊緣檢測的硬件連接電路圖

以下是基于 DSP5509 進行數字圖像處理中 Sobel 算子邊緣檢測的硬件設計方案：一、總體架構圖像采集：使用合適的圖像傳感器，如 CMOS 傳感器，通過相應的接口（如 SPI、I2C 等

發表于 09-25 15:25

NRK3502空氣凈化器語音芯片方案，本地識別算法+芯片架構

隨著環境污染問題的日益嚴重，空氣凈化器成為人們居家、辦公環境中不可或缺的設備，為了提升用戶體驗和產品性能，廣州九芯電子研發出了一款創新的空氣凈化器語音芯片方案--NRK3502。此方案結合了本地識別

發表于 09-19 08:02 ?382次閱讀

NRK3502空氣凈化器<b class='flag-5'>語音</b>芯片方案，<b class='flag-5'>本地</b>識別算法+芯片架構

智能邊緣服務器 --開啟計算新時代

一、智能邊緣服務器概念云尚通信技術（深圳）有限公司智能邊緣服務器是一種新型的計算設備，它被部署在網絡邊緣，靠近數據源和終端用戶。與傳統服務器相比，其獨特之處在于能夠更快速地處理和響應本地

發表于 08-13 11:01 ?360次閱讀

DSP國產教學實驗箱_實驗案例_操作教程：5-11 邊緣檢測

一、實驗目的學習Canny邊緣檢測的原理，掌握圖像的讀取方法，并實現邊緣檢測。二、實驗原理邊緣檢測在數字圖像中，邊緣是指圖像局部變化最顯著的部分，

發表于 07-19 10:38

卷積神經網絡激活函數的作用

卷積神經網絡（Convolutional Neural Networks, CNNs）是深度學習中一種重要的神經網絡結構，廣泛應用于圖像識別、語音識別、自然語言處理等領域。在卷積神經網絡中，激活函數

發表于 07-03 09:18 ?1198次閱讀

神經網絡中激活函數的定義及類型

引言神經網絡是一種模擬人腦神經元結構的計算模型，廣泛應用于圖像識別、自然語言處理、語音識別等領域。在神經網絡中，激活函數起著至關重要的作用，它決定了神經元的輸出值，進而影響整個網絡的性能。本文將

發表于 07-02 10:09 ?637次閱讀

邊緣計算網關是什么

? 邊緣計算網關（Edge Computing Gateway）是一種位于網絡邊緣的設備，它可以在本地處理和分析數據，從而減少對中心服務器的依賴。邊緣計算網關的主要目的是將數據處理任務

發表于 06-12 15:33 ?639次閱讀

邊緣計算是什么意思？邊緣計算的應用

，以及減少網絡擁塞。邊緣計算的核心概念包括： 1. 邊緣節點（Edge Node）：位于網絡邊緣的設備，負責處理本地數據和請求。這些設備可以是智能手機、IoT傳感器、路由器等。 2.

發表于 05-31 14:19 ?875次閱讀

邊緣計算網關是什么？有什么作用

在數字化時代，信息的傳輸與處理變得愈發重要，而其中的關鍵節點之一便是邊緣計算網關。這一先進的網絡設備，不僅擴展了云端功能至本地邊緣設備，還使得邊緣設備能夠自主、快速地響應本地事件，提供

發表于 04-16 15:25 ?4078次閱讀

邊緣Web智能網關是什么？邊緣Web智能網關的功能

Web智能網關具有以下功能： 1. 數據采集：可以在本地設備中采集數據，包括傳感器數據、系統狀態數據等，并將這些數據傳輸到云平臺。 2. 邊緣計算：可以執行一些數據處理任務，如數據清洗、數據過濾、數據歸納等，以提高數據的質量和可用性。 3

發表于 04-07 14:42 ?485次閱讀

LLM中的大規模激活

篇論文主要研究了大型語言模型（LLMs）中的一個現象，即在模型的隱藏狀態中存在極少數激活值（activations）遠大于其他激活值的情況，這些被稱為“massive activations”。

發表于 03-01 11:38 ?607次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

基于DSP改進邊緣的本地語音激活

評論

5g邊緣智能網關是什么

什么是邊緣計算網關？可以實現什么功能？

能在DSP的存儲器上存MP3或其他格式的音頻文件，由DSP讀后控制TLV320AIC23轉換成語音？

Sitara Linux ALSA DSP麥克風陣列語音識別

基于 DSP5509 進行數字圖像處理中 Sobel 算子邊緣檢測的硬件連接電路圖

NRK3502空氣凈化器語音芯片方案，本地識別算法+芯片架構

智能邊緣服務器 --開啟計算新時代

DSP國產教學實驗箱_實驗案例_操作教程：5-11 邊緣檢測

卷積神經網絡激活函數的作用

神經網絡中激活函數的定義及類型

邊緣計算網關是什么

邊緣計算是什么意思？邊緣計算的應用

邊緣計算網關是什么？有什么作用

邊緣Web智能網關是什么？邊緣Web智能網關的功能

LLM中的大規模激活