色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何實現更高效的VLN算法

深度學習自然語言處理 ? 來源:CAAI認知系統與信息處理專 ? 作者:CAAI認知系統與信息 ? 2022-07-13 14:54 ? 次閱讀

視覺-語言導航任務(Vision-Language Navigation, VLN)是指在陌生環境中,無人系統依據語言指示和觀測圖像之間的跨模態匹配信息,進行自主智能路徑導航的方法。不同于前進、后退等簡單操控指令,VLN采用類似人人交互的語言指示,比如“走出右側大門,穿過臥室和客廳,在綠色地毯上的餐桌旁停下”。VLN是一種新型的跨模態智能人機交互方法,能夠極大地提升無人系統的自主能力,能夠為無人系統走向實用提供關鍵技術支撐。

序列到序列(Sequence to Sequence, Seq2Seq)模型是VLN最常見的模型之一。Seq2Seq首先對語言指令進行序列編碼,再根據逐步觀測的視覺圖像,進行序列移動方向預測解碼,從而實現智能導航。最新的研究表明:在解碼時,利用Beam-Search進行多條路徑探索,通過路徑評價函數獲得最優導航路徑,可以獲得更好的導航精度。但現有工作使用的路徑評價函數是由局部方向選擇算子組合構建的,在全局多條路徑對比上能力不足,可能會出現嚴重偏差,如圖1。

d1536476-01c9-11ed-ba43-dac502259ad0.png

圖1 VLN分數偏差問題示例

為了解決該問題,軍事科學院國防科技創新研究院智能人機交互團隊設計了新型全局路徑評估函數,提出了一種全局對比訓練的策略,大幅提升了VLN的導航精度。相關論文《Vision-Language Navigation with Beam-Constrained Global Normalization》已被國際知名期刊 IEEE Transactions on Neural Networks and Learning Systems錄用;該論文在提交時,算法性能在公開VLN數據集R2R(Room-to-Room)上排名第一。

d16cc222-01c9-11ed-ba43-dac502259ad0.jpg

榜單地址:https://eval.ai/web/challenges/challenge-page/97/leaderboard/270

主要工作與貢獻該論文提出了一種基于全局對比訓練的視覺-語言導航方法,可以對候選路徑進行跨模態全局匹配評估。不同于傳統方法,該論文主要聚集在如何利用正確路徑和錯誤路徑進行對比訓練,獲得較優的全局語言-路徑匹配評估函數,有效提升VLN的導航精度。論文算法框架可以分為兩個部分:(1)Baseline:Seq2Seq模型,基于局部訓練的序列動作預測,用于訓練語言-路徑匹配的局部評估函數;(2)全局對比訓練模型:基于全局對比訓練的全局評估函數。在測試時,將局部評估函數和全局評估函數進行結合,實現高精度的導航路徑預測,如圖2所示。

d1a03f94-01c9-11ed-ba43-dac502259ad0.png

圖2 基于全局對比訓練的VLN框架

A Baseline 如圖2所示,該論文選擇Seq2Seq模型作為Baseline,首先將語言信息進行編碼,再基于視覺信息進行動作預測解碼。語言編碼:利用LSTM對輸入的自然語言文本進行編碼,獲得文本指令的特征向量。視覺編碼:利用ResNet-152對觀測圖像進行特征提取,結合運動方向特征進行視覺編碼。動作預測:采用Seq2Seq模型進行動作解碼,獲得序列導航動作。進度監視器:作為一項必不可少的輔助推理任務,進度監視器可以提供來自環境的額外訓練信息。訓練:局部對比訓練,只考慮當前環境及下一步動作。局部評估函數:通過將局部方向選擇概率值累加,獲得整個路徑與描述語言的匹配度。B 基于Beam-Search的全局對比訓練策略

Baseline將一個路徑的匹配度計算分解為單步方向選擇得分累加,由于單步方向得分是單獨計算的,沒有明確涵蓋全局信息,因此將Baseline評估函數稱為局部評估函數。由于局部評估函數沒有從全局視角考慮路徑和語言的匹配度,所以局部得分累加的方式容易出現匹配錯誤,為了緩解這一問題,本文提出了明確的全局匹配評估函數,并設計了全局訓練策略進行優化訓練,從而獲得高效的全局匹配評估函數。

具體來說,本文訓練了一個全局評估子模型,主要用來進行路徑-語言全局匹配評估,從而使得不同路徑的評估得分更加具有可比性。

d1b792b6-01c9-11ed-ba43-dac502259ad0.png

圖3 深度多模態相似性模塊和speaker模塊示意圖

DMSM模塊:計算語言的整體描述特征與路徑視覺的整體描述特征之間的距離;距離越近,則路徑和語言越匹配。Speaker模塊:根據路徑反向生成指令語言的概率,是VLN的逆命題,可以反映全局路徑和語言的匹配度。全局對比訓練:在訓練時,利用Beam-Search搜索出多條正確路徑和多條錯誤路徑,設計對比損失函數,使得正確路徑得分高于錯誤路徑,可以有效地對全局評估模塊DMSM和Speaker模塊進行訓練。全局評估函數:在測試時,對于任意一對路徑和語言,分別利用DMSM和Speaker模塊對二者之間的匹配度進行計算,通過線性疊加,可以獲得該路徑的全局評估得分。

實驗結果算法的測試是在VLN公開數據集上進行的。本文對比了多個現有經典VLN算法,實驗結果表明,本文提出的算法導航精度比Baseline高出13%,顯著度較高;在同期VLN算法的導航精度最高,證明了本文算法的有效性。

d1cca2fa-01c9-11ed-ba43-dac502259ad0.png

總結與展望本研究提出了一種 VLN 全局對比訓練方法,用于緩解現有局部評估函數在全局路徑-語言匹配評估方面的不足。該方法核心要點是如何從錯誤路徑/負樣本中學到有用的信息,這是現有其他VLN算法關注較少的地方,也是本文的落腳點,實驗結果表明了本文方法的有效性。

最近,通過視覺-語言跨模態預訓練模型在VLN中性能表現優越,比如VLN BERT,相對于傳統LSTM模型,預訓練能夠獲得更多的先驗知識,能夠為VLN提供更魯棒的基礎框架,本文未來工作將在VLN BERT等預訓練模型的基礎上,進一步利用全局對比訓練方法,實現更高效的VLN算法。

原文標題:VLN: 基于全局對比訓練的視覺-語言導航方法

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 智能導航
    +關注

    關注

    0

    文章

    23

    瀏覽量

    9961
  • 函數
    +關注

    關注

    3

    文章

    4338

    瀏覽量

    62739
  • 訓練模型
    +關注

    關注

    1

    文章

    36

    瀏覽量

    3868

原文標題:VLN: 基于全局對比訓練的視覺-語言導航方法

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【「從算法到電路—數字芯片算法的電路實現」閱讀體驗】+內容簡介

    內容簡介這是一本深入解讀基礎算法及其電路設計,以打通算法研發到數字IC設計的實現屏障,以及指導芯片設計工程師從底層掌握復雜電路設計與優化方法為目標的專業技術書。任何芯片(如WiFi芯片、5G芯片
    發表于 11-21 17:14

    【「從算法到電路—數字芯片算法的電路實現」閱讀體驗】+一本介紹基礎硬件算法模塊實現的好書

    作為嵌入式開發者往往比較關注硬件和軟件的協調。本書介紹了除法器,信號發生器,濾波器,分頻器等基本算法的電路實現,雖然都是基礎內容,但是也是最常用到的基本模塊,本書的內容比較對本人胃口。 我們先來
    發表于 11-20 13:42

    盛顯科技:拼接處理器如何實現高效數據拼接操作?

    推動各行各業數字化轉型與提升用戶體驗的關鍵力量。那么您知道拼接處理器如何實現高效數據拼接操作?下面盛顯科技小編為您介紹: 拼接處理器實現高效數據拼接操作,主要可以通過以下幾個方面來達成
    的頭像 發表于 10-23 10:58 ?260次閱讀
    盛顯科技:拼接處理器如何<b class='flag-5'>實現</b><b class='flag-5'>高效</b>數據拼接操作?

    使用qboot時選擇了壓縮率更高的zip算法,但是發現編譯報錯,為什么?

    在使用qboot時選擇了壓縮率更高的zip算法,但是發現編譯報錯,如下圖:
    發表于 09-26 07:22

    C加密算法實現

    電子發燒友網站提供《C加密算法實現.pdf》資料免費下載
    發表于 09-20 11:10 ?1次下載
    C加密<b class='flag-5'>算法</b>的<b class='flag-5'>實現</b>

    智能升級,樓宇自控系統讓辦公更高效

    智能升級,樓宇自控系統讓辦公更高效 在快節奏的現代都市生活中,辦公效率成為了企業競爭力的關鍵因素之一。隨著科技的飛速發展,樓宇自控系統作為智能建筑的核心技術,正逐步滲透到我們的辦公環境中,以其獨特
    的頭像 發表于 09-19 14:12 ?280次閱讀

    GaN如何實現更高效、更緊湊的電源

    電子發燒友網站提供《GaN如何實現更高效、更緊湊的電源.pdf》資料免費下載
    發表于 09-12 10:00 ?0次下載
    GaN如何<b class='flag-5'>實現</b><b class='flag-5'>更高效</b>、更緊湊的電源

    充電也要算法?儲能充電芯片中的算法處理器

    或充電設備中,負責實時監控電池狀態,執行充電策略,并調整充電參數,如電流和電壓。 ? 比如算法處理器可以執行復雜的充電算法,如恒流/恒壓充電、脈沖充電、智能協商充電等,這些算法能夠根據電池的狀態調整充電參數,
    的頭像 發表于 07-30 00:07 ?3736次閱讀

    如何使用PyTorch構建更高效的人工智能

    術界和工業界得到了廣泛應用。本文將深入探討如何使用PyTorch構建更高效的人工智能系統,從框架基礎、模型訓練、實戰應用等多個方面進行詳細解析。
    的頭像 發表于 07-02 13:12 ?396次閱讀

    STM32如何詮釋電機控制創新 如何更高效更智能

    為了提高電機系統的效率,電機控制技術大有可為。通過采用性能更高、集成度更高的半導體器件,功能強大且安全的微控制器,更智能的傳感器,結合更優化的軟件算法,可實現提升效率、降低損耗的目的。
    發表于 06-06 10:44 ?811次閱讀
    STM32如何詮釋電機控制創新 如何<b class='flag-5'>更高效</b>更智能

    笙泉、呈功攜手推出FOC智能型調機系統,實現高效開發馬達控制產品

    本帖最后由 noctor 于 2024-6-3 14:45 編輯 笙泉、呈功攜手推出FOC智能型調機系統,實現高效開發馬達控制產品 FOC智能型調機系統笙泉科技 近幾年持續致力于開發
    發表于 06-03 11:58

    FPGA能實現什么樣的算法

    FPGA功能如此強大,請問用FPGA能實現或者比較適合實現什么樣的算法
    發表于 05-26 20:18

    深圳特信電子|車載車庫GPS信號探測器:讓停車管理更高效智能

    深圳特信電子|車載車庫GPS信號探測器:讓停車管理更高效智能
    的頭像 發表于 05-23 08:54 ?357次閱讀

    視頻光纖矩陣技術的發展趨勢:更快、更穩定、更高效

    隨著信息技術的迅猛發展,視頻光纖矩陣技術作為高清視頻傳輸與處理的核心技術,正迎來其發展的黃金時期。未來,視頻光纖矩陣技術的發展將呈現出更快、更穩定、更高效的趨勢。 首先,速度的提升是視頻光纖矩陣
    的頭像 發表于 02-19 14:44 ?370次閱讀

    怎么用FPGA做算法 如何在FPGA上實現最大公約數算法

    FPGA算法的優點在于它們可以提供高度的定制化和靈活性,使得算法可以根據實際需求進行優化和調整。此外,FPGA還可以實現硬件加速,提供比傳統處理器更高的計算性能和吞吐量。因此,FPGA
    的頭像 發表于 01-15 16:03 ?2421次閱讀
    主站蜘蛛池模板: 亚洲高清国产拍精品5g| 亚洲乱码国产乱码精品精98| 久久久97丨国产人妻熟女| 激情内射亚洲一区二区三区| 娇小萝被两个黑人用半米长| 久久yy99re66| 快播性爱电影| 欧美日韩在线成人看片a| 日本免费一本天堂在线| 天天国产在线精品亚洲| 亚洲AV无码专区国产乱码网站| 亚洲三级精品| 2019一級特黃色毛片免費看| 超碰97免费人妻| 国产精品一区二区四区| 黄色精品视频| 男人的天堂黄色片| 色柚视频网站ww色| 亚洲日本激情| 99久久精品全部| 俄罗斯大肥BBXX| 教室眠催白丝美女校花| 哪里能看毛片| 天堂岛www天堂资源在线| 亚洲一区二区三区乱码在线欧洲| 97成人在线视频| 国产成人无码精品久久久影院| 果冻传媒最新视频在线观看| 麻豆XXXX乱女少妇精品-百度| 热久久伊大人香蕉网老师| 亚洲高清视频免费| 97SE亚洲国产综合在线| 高h np 强j 乱l 双性| 精品无码国产AV一区二区三区| 牛牛自拍国产免费视频| 午夜日本大胆裸艺术| 2021国产精品一卡2卡三卡4卡 | 久久婷婷五月免费综合色啪| 青草国产在线视频免费| 亚洲免费黄色| www.日本 高清.com|