具有數十億參數的神經網絡為ChatGPT和Dall-E等基于人工智能的日常工具提供了動力,每一個新的大型語言模型(LLM)在大小和復雜性上都優于其前身。與此同時,在麻省理工學院的計算機科學與人工智能實驗室(CSAIL),一組研究人員在最近的研究中,展示了一種稱為液體神經網絡的小型20000參數機器學習系統的效率。
研究人員介紹了一種方法,使無人機能夠在復雜和陌生的環境中掌握基于視覺的飛向目標任務。該團隊使用了不斷適應新數據輸入的液體神經網絡。他們表明,配備這些設備的無人機在復雜、全新的環境中表現出色,精度很高,甚至超過了最先進的系統。這些系統能夠做出決策,將他們帶到以前未被探索的森林和城市空間中的目標,并且他們可以在存在額外噪音和其他困難的情況下這樣做。
典型的機器學習系統中的神經網絡只在訓練過程中學習。之后,它們的參數被固定。CSAIL的科學家之一Ramin Hasani解釋說,液體神經網絡是一類在工作中學習的人工智能系統,即使在經過訓練后也是如此。換句話說,他們利用“液體”算法,不斷適應新的信息,比如新的環境,就像生物體的大腦一樣。Hasani說:“它們是根據生物大腦中神經元和突觸的相互作用直接建模的。” 事實上,它們的網絡結構受到了被稱為C. elegans的生物的神經系統的啟發,秀麗隱桿線蟲是一種常見于土壤中的微小蠕蟲。
Hasani說,這項實驗的目的不僅僅是無人機強大的自主導航。“這是關于測試神經網絡作為自主系統部署在我們的社會中時的任務理解能力。”
作為控制無人機的神經網絡的訓練數據,研究人員使用了一名人類飛行員向目標飛行時收集的無人機鏡頭。Hasani說:“你會預期系統已經學會了向物體移動。”但是,他沒有定義物體是什么,也沒有提供任何關于環境的標簽。“無人機必須推斷出任務是這樣的:我想向(物體)移動。”
該團隊進行了一系列實驗,測試學習的導航技能是如何轉移到前所未有的新環境中的。他們在許多現實世界的環境中測試了該系統,包括在森林的不同季節和城市環境中。無人機進行了航程和應力測試,目標被旋轉、遮擋、移動等等。液體神經網絡是唯一一種可以在沒有任何微調的情況下推廣到他們從未見過的場景的網絡,并且可以無縫可靠地執行這項任務。
液體神經網絡在機器人技術中的應用可能會帶來更強大的自主導航系統,用于搜救、野生動物監測和運送等。Hasani表示,隨著城市密度的增加,智能出行將至關重要,而這些神經網絡的小尺寸可能是一個巨大的優勢:“我們可以在樹莓派上實現一個可以駕駛汽車的液體神經網絡。”
“
超越無人機和機動性
但研究人員認為,液體神經網絡可以走得更遠,成為與任何類型的時間序列數據處理相關的決策的未來,包括視頻和語言處理。由于液體神經網絡是序列數據處理引擎,它們可以預測金融和醫療事件。例如,通過處理生命體征,可以開發模型來預測ICU中患者的狀態。
除了其他優勢外,液體神經網絡還提供了可解釋性和可解讀性。換句話說,他們打開了眾所周知的系統決策過程的黑匣子。Hasani說:“如果我(在無人機系統中)只有34個神經元,我就可以去弄清楚每個元素的功能。”這在大規模的深度神經網絡中幾乎是不可能的。更小尺寸的液體神經網絡也大大降低了機器學習模型的計算成本,從而減少了碳足跡。
Hasani和他的同事正在尋找改進液體神經網絡的方法。他說:“這篇論文涵蓋了一種非常可控和直接的推理能力,但現實世界的交互則需要越來越多復雜的推理問題解答。” 該團隊希望設計更復雜的任務,并對液體神經網絡進行極限測試,同時也要弄清楚為什么液體神經網絡在推理測試中比競爭對手表現得好得多。
審核編輯 :李倩
-
神經網絡
+關注
關注
42文章
4773瀏覽量
100885 -
人工智能
+關注
關注
1792文章
47406瀏覽量
238913 -
機器學習
+關注
關注
66文章
8424瀏覽量
132762
原文標題:液態神經網絡無人機在未知領域航行時擊敗了其他人工智能系統
文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論