資料介紹
描述
這是在使用 32 位浮點精度的微控制器上訓練深度學習模型的嘗試。我們通過構建一個機器人來實現這一點,該機器人學習如何使用深度強化學習以最小距離跟隨最近的障礙物。訓練過程的演示可以在這里找到。
訓練過程的演示可以在這里找到。該項目的靈感來自于Pete Warden ( Google TensorFlow)、Neil Tan (ARM) 在微控制器上運行神經網絡所做的工作。
介紹
實時機器學習 (RTML) 是指主動解釋和學習實時到達的數據。它要求代理人根據先前的知識解決不熟悉的問題,并經常做出實時決策。我們在嵌入式系統的開發和部署環境中討論 RTML。
目前,地球上活躍著近 150 億個嵌入式處理器,它們收集并有時處理大量數據。這些數據中的大部分都被丟棄了,因為這些微型計算機通常不具備在其上運行復雜解釋任務的硬件功能。出于這個原因,數據通過無線網絡發送到功能更強大的中央計算機進行處理。但是這種形式的基于云的架構(其中邊緣設備僅執行數據收集)可能由于以下原因而變得不利:
- 發送數據需要邊緣設備和中央計算機之間的通信。這個過程對處理器來說是非常耗能的,因此只能間歇性地完成
- 由于無線通信協議的設計方式,傳輸數據時的延遲保證權衡是不可避免的。這可能會嚴重延遲從數據中采取關鍵行動的時間。
- 關于數據包從微處理器到達和被微處理器接收所花費的時間,無線通信協議也具有不確定的行為,這對于需要關鍵響應的任務來說也是非常不希望的。
- 這種不確定的通信鏈路要求微處理器幾乎一直處于活動狀態,這是空閑功耗的主要來源之一。
這就是深度學習的力量所在。深度學習算法實現中最大最密集的操作是矩陣乘法,硬件高效實現已經存在并且完全受算術限制。即使使用現有技術,微處理器和 DSP 也能夠在不到一毫瓦的情況下處理數千萬或數億次計算,而且更高效的低能耗加速器即將出現。經過訓練后,這些模型能夠運行復雜的推理任務并保持對噪聲的穩健性,這是實時數據的典型特征。通過在邊緣設備中加入深度學習功能使邊緣設備更智能,將解決所有源于數據交換的問題,并使其成為從現實世界數據中快速做出重要決策的合適且可靠的候選者。設備在部署到現場后還可以進行持續改進。
以下是深度學習框架如何在資源受限的嵌入式系統上開發和運行的一些更廣泛的方法:
- 現有算法的內存高效實現
- 低精度量化訓練/推理
- 訓練期間的低精度乘法
- 使用修剪和霍夫曼編碼壓縮神經網絡
- 使浮點數學對 AI 硬件高效
在本項目中,我們重點介紹第一種方法,并簡要介紹第二種方法。據我們所知,這將是第一個開發用于在具有平臺獨立性的嵌入式系統上訓練和運行推理的深度學習庫。
使用深度策略梯度網絡進行強化學習
有關策略梯度網絡的精彩介紹,請參閱本教程。所有用于矩陣操作和實施深度學習算法的庫都是用 C++ 自定義編寫的。
對于這個項目,網絡構建如下:
- 輸入層的維度為 1x1。它攜帶超聲波傳感器測量到的最近障礙物的距離。
- 隱藏層的維度為 3x1,具有 RELU 激活。
- 輸出層的維度為 5x1,具有 softmax 激活,對應于機器人可以行進的 5 種可能速度。
訓練在每一集之后進行,其中網絡對 5 個動作進行采樣,執行它們并存儲計算出的獎勵。
- 基于強化學習的目標檢測算法案例 0次下載
- [ESP32]學習筆記02
- 使用Matlab進行強化學習電子版資源下載 0次下載
- 基于強化學習的虛擬場景角色乒乓球訓練 62次下載
- 基于深度強化學習的無人機控制律設計方法 46次下載
- 一種新型的多智能體深度強化學習算法 36次下載
- 基于深度強化學習仿真集成的壓邊力控制模型 0次下載
- 基于強化學習的壯語詞標注方法 14次下載
- 基于深度強化學習的路口單交叉信號控制 21次下載
- 模型化深度強化學習應用研究綜述 9次下載
- 機器學習中的無模型強化學習算法及研究綜述 11次下載
- 深度強化學習的筆記資料免費下載 0次下載
- ESP32教程之如何在Windows系統上搭建開發環境 40次下載
- 使用加權密集連接卷積網絡的深度強化學習方法說明 3次下載
- 如何使用深度強化學習進行機械臂視覺抓取控制的優化方法概述 22次下載
- 通過強化學習策略進行特征選擇 210次閱讀
- 基于深度強化學習的視覺反饋機械臂抓取系統 1896次閱讀
- 使用ESP32實現UDP通信的方法 5723次閱讀
- ESP8266/ESP32自動下載原理 4249次閱讀
- 如何在ESP32上使用代碼運行TensorFlow模型? 4526次閱讀
- 深度強化學習給推薦系統以及CTR預估工業界帶來的最新進展 8580次閱讀
- 多智體深度強化學習研究中首次將概率遞歸推理引入AI的學習過程 4743次閱讀
- 對NAS任務中強化學習的效率進行深入思考 4888次閱讀
- 量化深度強化學習算法的泛化能力 2275次閱讀
- 如何構建強化學習模型來訓練無人車算法 4769次閱讀
- 基于強化學習的MADDPG算法原理及實現 2.1w次閱讀
- 用PopArt進行多任務深度強化學習 5546次閱讀
- 強化學習環境研究,智能體玩游戲為什么厲害 3530次閱讀
- 什么是強化學習?純強化學習有意義嗎?強化學習有什么的致命缺陷? 1.7w次閱讀
- 斯坦福提出基于目標的策略強化學習方法——SOORL 5269次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數據手冊
- 1.06 MB | 532次下載 | 免費
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費
- 3TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費
- 5元宇宙深度解析—未來的未來-風口還是泡沫
- 6.40 MB | 227次下載 | 免費
- 6迪文DGUS開發指南
- 31.67 MB | 194次下載 | 免費
- 7元宇宙底層硬件系列報告
- 13.42 MB | 182次下載 | 免費
- 8FP5207XR-G1中文應用手冊
- 1.09 MB | 178次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應用800例(新編版)
- 0.00 MB | 33566次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關電源設計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數字電路基礎pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅動電路設計》 溫德爾著
- 0.00 MB | 6656次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537798次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191187次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論
查看更多