無論是每天早晨的例行公事,還是其他點點滴滴,永遠在線(Always-On)蘊含的無限潛力都能助您一臂之力,讓生活更加簡單便利。移動系統、可穿戴設備和許多其他物聯網(IoT)應用都需要這項技術——系統中的一些計算資源永遠在線,隨時處理音頻、視頻或其他傳感器數據。為了進一步增強電池供電設備的可用性,專門用于Always-On任務的計算資源應經過專門優化;而系統中的其他資源則可保持休眠,直到真正需要時再被喚醒。
毋庸置疑,新一代產品正在重新詮釋我們對人機界面的理解,對比短短5年前,現在的用戶體驗已經變得更加豐富多彩,引人入勝。但這也給設計師帶來了全新的挑戰:如何在繼續為客戶營造愉悅體驗的前提下,實現響應速度、成本和功耗之間的平衡?本文中,我們將就此問題進行探討,并介紹如何采用“認知分層”的方法搭建Always-On架構,幫助設計師實現產品設計的最佳平衡。
設計高效節能的Always-On架構
針對特定的IoT應用,片上系統(SoC)由多種模擬器件(例如無線電、低噪聲放大器(RX)、電源管理單元和集成功率放大器)及數字器件(例如處理器、數字信號處理器、片上存儲器、數字基帶硬件組塊和豐富的傳感器I/O)構成。
包括麥克風、攝像頭、加速計、陀螺儀、溫度計和壓力計等在內的傳感器是智能、互聯,Always-On設備的核心。傳感器對收集到的數據進行數字化處理,并將數字化信息發送到SoC進行分析和解讀。
Always-On架構的開發可同時采用多項技術,降低IoT應用的功耗:
●功耗、時鐘和數據門控
●傳感器融合算法,用于確定設備上下文,并以此為基礎實現系統功耗的智能管理
●針對開銷巨大的函數進行優化,例如:
●從指令集層面減少時鐘周期開銷數(cycle)從而降低對頻率的需求(MHz)
●在互聯級架設通用片上總線旁路
●通過存儲分區使流量局部化
●針對語音算法、加密等同類應用,加快通信標準和性能
除上述技術外,認知分層尤其是實現最佳功耗/性能平衡的理想方案。下面,我們將進行更詳細的論述。
認知分層:主處理器任務負載卸載
認知分層將任務劃分成若干層或狀態,分別使用經過專門優化的引擎處理。通過將一些任務轉移到經過專門優化的低功耗Always-On處理器,認知分層即可實現主處理器任務分流。圖1描述了語音觸發應用,每層的處理能力恰好足夠支持系統此刻所需的響應速度,且不會浪費資源。采用此方法,延遲、功耗和吞吐量性能都會得到提升。
圖1:認知分層可以最大限度地降低功耗
圖1中最靠下的環節是低功耗噪聲檢測,耗能僅為毫微瓦級。從檢測觸發命令到識別短語,以及當前應用上下文環境下的解讀,噪聲檢測會沿處理鏈向上觸發一系列系統動作。這一系列動作中,后一個動作的功耗總是略高于前一個動作。使用云服務處理完整對話需要訪問遠程服務器及數據庫,并進行交互,因此能耗最高,可以達到數瓦。
在較低層,根據特定的計算和接口要求專門設計并優化過的處理引擎,將取代低效率的通用處理器。相比通用處理器,經過專門優化的處理器在Always-On系統中的性能更高,響應延遲更短,功耗更低。
通過盡可能關閉不必要的系統,認知分層使計算層與數據來源更加接近,系統可以調用最少的活動資源完成當前任務。認知分層可以優化性能和功耗,適用于從慣性導航到計算機視覺,再到本地無線通信等多種IoT應用領域。
優秀Always-On處理器的要素
IoT應用豐富多彩,對處理能力的要求也因應用而異,“一刀切”的作法對Always-On處理器并不適用?;谏鲜鰧φJ知分層的闡釋,小型、低功耗、高度專業化的處理器可以承擔對認知功能要求較低的工作,減少占用主處理器資源,降低功耗。
例如,經過低功耗語音觸發優化的數字信號處理器(DSP)不會處理高耗能的音頻編解碼工作,而是將之移交專為該用途設計的DSP;與之類似,經過音頻編解碼優化的DSP,也會將用戶和網絡交互的任務移交給其他為該用途設計的應用處理器。
圖2:低功耗處理器為日趨復雜的信號處理保駕護航
盡管主應用處理器“可以”運行所有算法,但使用經過專門優化的處理器能讓設計更加節能。在上述的語音觸發示例中,指定使用低功耗Always-On DSP運行語音觸發器當然也可以將之用于執行其他低功耗要求的任務,例如傳感器數據處理和低分辨率圖像處理。如圖2所示,可穿戴設備等IoT應用需要具備超低功耗下處理復雜信號的能力。
支持Always-On應用的處理器需要具備以下要素:
●針對關鍵算法的低指令執行周期,高效的指令集
●執行DSP處理和控制任務的能力
●低功耗設計
●尺寸小,理想情況下可以按需配置,并可以去除冗余的邏輯設計
●按所需的功能范圍擴展性能
●用于傳感器數據處理的高效浮點運算
面向IoT、可穿戴設備和無線應用的靈活DSP
Cadence公司的Tensilica Fusion DSP就屬于單一可擴展DSP,可以滿足低功耗及Always-On功能的各項需求。Cadence Tensilica Fusion DSP使用可選擇的指令集架構(ISA)擴展,加快多種無線協議和浮點運算的速度;并將增強型32位Xtensa控制處理器與DSP功能及靈活的特定算法加速相結合。作為IoT設備設計師,您可以按需選擇個性化的配置,對比配置單一的“一刀切”處理器,Tensilica Fusion DSP的尺寸更小,性能更高,功耗也更低。
圖3:Cadence Tensilica Fusion DSP基于Xtensa處理器,由多項可配置元件構成,適用于低功耗Always-On系統。
Tensilica Fusion DSP(圖3)的可配置元件包括:
●單精度浮點單元——浮點指令與64位數據讀取/寫回同時發射。這對使用MATLAB或標準C代碼創建算法的軟件來說,開發速度可以得到加快。
●音頻/語音(AVS)——與TensilicaHiFi DSP共享軟件兼容性,由140余個HiFi音頻/語音軟件包構成的生態系統為其提供支持。
●16位Quad MAC——進一步加速低功耗藍牙及Wi-Fi等通信標準,同時配有語音編解碼器/識別算法。
●為低功耗藍牙和Wi-Fi AES-128無線操作實現的加密提速
●先進的位處理——加快基帶MAC和PHY的設計實現
●適用于高速緩存和/或不同容量的本地內存的、靈活的內存架構
總結
Always-On技術在生活中的運用越來越廣泛。設計出成功的Always-On產品充滿挑戰,特別是如何找到響應速度、成本和功耗的平衡點。
采用認知分層,同時使用可配置的低功耗Always-On DSP,能助您找到這一平衡點。通過將Always-On功能分配給低功耗處理器,系統的主處理器則可以將資源用于處理更復雜的任務,從而優化設計,在不犧牲性能及功能性的前提下,消耗最小的能源執行任務處理。
編輯:hfy
-
傳感器
+關注
關注
2551文章
51163瀏覽量
754123 -
處理器
+關注
關注
68文章
19312瀏覽量
230028 -
功率放大器
+關注
關注
102文章
3589瀏覽量
131950 -
人機界面
+關注
關注
5文章
527瀏覽量
44144
發布評論請先 登錄
相關推薦
評論