色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種在視覺語言導航任務中提出的新方法,來探索未知環境

電子工程師 ? 來源:lp ? 2019-03-05 09:38 ? 次閱讀

CVPR 2019 接收論文編號公布以來,AI科技大本營開始陸續為大家介紹一些優秀論文。今天推薦的論文,將與大家一起探討一種在視覺語言導航任務中提出的新方法,來探索未知環境。

作者

這篇論文是 UC Santa Barbara 大學(加州大學圣巴巴拉分校)與微軟研究院、Duke 大學合作完成,第一作者系 UC Santa Barbara 大學的王鑫。

據 UC Santa Barbara 計算機科學系助理教授王威廉在其個人微博上發表的喜訊,這篇論文的一作是其組內的成員,獲得了 3 個 Strong Accept,在 5165 篇投稿文章中審稿得分排名第一,并且這篇論文已經確定將在 6 月的 CVPR 會議上進行報告。

這篇論文解決的任務 vision-language navigation(VLN)我們之前介紹的并不多,所以,這次營長會先給大家簡單介紹 VLN,然后從這項任務存在的難點到解決方法、實驗效果等方面為大家介紹,感興趣的小伙伴們可以從文末的地址下載論文,詳細閱讀。

什么是 VLN?

視覺語言導航(vision-language navigation, VLN)任務指的是引導智能體或機器人在真實三維場景中能理解自然語言命令并準確執行。結合下面這張圖再形象、通俗一點解釋:假如智能體接收到“向右轉,徑直走向廚房,然后左轉,經過一張桌子后進入走廊...”等一系列語言命令,它需要分析指令中的物體和動作指令,在只能看到一部分場景內容的情況下,腦補整個全局圖,并正確執行命令。所以這是一個結合 NLP 和 CV 兩大領域,一項非常有挑戰性的任務。

難點

雖然我們理解這項任務好像不是很難,但是放到 AI 智能體上并不像我們理解起來那么容易。對 AI 智能體來說,這項任務通常存在三大難點:

難點一:跨模態的基標對準(cross-modal grounding);簡單解釋就是將NLP 的指令與 CV 場景相對應。

難點二:不適定反饋(ill-posed feedback);就是通常一句話里面包含多個指令,但并不是每個指令都會進行反饋,只有最終完成任務才有反饋,所以難以判斷智能體是否完全按照指令完成任務。

難點三:泛化能力問題;由于環境差異大,VLN 的模型難以泛化。

那這篇論文中,作者又做了哪些工作,獲得了評委們的一致青睞,獲得了 3 個 Strong Accept 呢?方法來了~

方法

1、RCM(Reinforced Cross-Modal Matching)模型

針對第一和第二難點,論文提出了一種全新的強化型跨模態匹配(RCM)方法,用強化學習方法將局部和全局的場景聯系起來。

RCM 模型主要由兩個模塊構成:推理導航器和匹配度評估器。如圖所示,通過訓練其中綠色的導航器,讓它學會理解局部的跨模態場景,推斷潛在的指令,并生成一系列動作序列。另外,論文還設置了匹配度評估器(Matching Critic)和循環重建獎勵機制,用于評價原始指令與導航器生成的軌跡之間的對齊情況,幫助智能體理解語言輸入,并且懲罰不符合語言指令的軌跡。

以上的方法僅僅是解決了第一個難點,所以論文還提出了一個由環境驅動的外部獎勵函數,用于度量每個動作成功的信合和導航器之間的誤差。

2、SIL(Self-supervised Imitation Learning)方法

為了解決第三個難點,論文提出了一種自監督模仿學習(Self-supervised Imitation Learning, SIL),其目的是讓智能體能夠自主的探索未知的環境。其具體做法是,對于一個從未見過的語言指令和目標位置,導航器會得到一組可能的軌跡并將其中最優的軌跡(采用匹配度評估器)保存到緩沖區中,然后匹配度評估器會使用之前介紹的循環重建獎勵機制來評估軌跡,SIL方法可以與多種學習方法想結合,通過模仿自己之前的最佳表現來得到更優的策略。

測試結果

1、測試集:R2R(Room-to-Room)Dataset;視覺語言導航任務中一個真實 3D環境的數據集,包含 7189 條路徑,捕捉了大部分的視覺多樣性,21567 條人工注釋指令,其平均長度為 29 個單詞。

2、評價指標

PL:路徑長度(Path Length)

NE:導航誤差(Navigation Error)

OSR:Oracle 成功率(Oracle Success Rate

SR:成功率( Success Rate)

SPL:反向路徑長度的加權成功率(Success rate weighted by inverse Path Length)

3、實驗對比:與 SOTA 進行對比,此前在 R2R 數據集上效果最優的方法。

Baseline:Random、seq2seq、RPA 和 Speaker-Follower。

測試結果顯示,RCM 模型的效果在 SPL 指標上明顯優于當前的最優結果。

并且在 SIL 方法學習后,學習效率也有明顯的提高,在見過和未見過的場景驗證集上,并可視化了其內部獎勵指標。

論文地址:

https://arxiv.org/pdf/1811.10092.pdf

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 智能體
    +關注

    關注

    1

    文章

    264

    瀏覽量

    10968
  • 自然語言
    +關注

    關注

    1

    文章

    291

    瀏覽量

    13608
  • nlp
    nlp
    +關注

    關注

    1

    文章

    490

    瀏覽量

    22488

原文標題:CVPR 2019審稿滿分論文:中國博士提出融合CV與NLP的視覺語言導航新方法

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦
    熱點推薦

    文詳解視覺語言模型

    視覺語言模型(VLM)是一種多模態、生成式 AI 模型,能夠理解和處理視頻、圖像和文本。
    的頭像 發表于 02-12 11:13 ?1509次閱讀
    <b class='flag-5'>一</b>文詳解<b class='flag-5'>視覺</b><b class='flag-5'>語言</b>模型

    大華股份榮獲中國創新方法大賽等獎

    ,大華股份憑借其卓越的創新能力和深厚的技術積累,脫穎而出,斬獲了全國等獎。大華股份的獲獎項目為“不懼強光,分毫必現,基于TRIZ的強逆光銳捕技術”。該項目通過靈活運用創新方法,成功突破了行業性技術難題,實現了強逆光
    的頭像 發表于 12-27 14:50 ?486次閱讀

    基于遺傳算法的QD-SOA設計新方法

    了QD-SOA的設計,提出一種基于遺傳算法的QD-SOA設計新方法。由于具有用于設計的模型是必不可少的,因此步中獲得數值模型。然后,
    的頭像 發表于 12-17 09:58 ?387次閱讀
    基于遺傳算法的QD-SOA設計<b class='flag-5'>新方法</b>

    一種降低VIO/VSLAM系統漂移的新方法

    本文提出一種新方法,通過使用點到平面匹配將VIO/VSLAM系統生成的稀疏3D點云與數字孿生體進行對齊,從而實現精確且全球致的定位,無需視覺
    的頭像 發表于 12-13 11:18 ?612次閱讀
    <b class='flag-5'>一種</b>降低VIO/VSLAM系統漂移的<b class='flag-5'>新方法</b>

    NaVILA:加州大學與英偉達聯合發布新型視覺語言模型

    日前,加州大學的研究人員攜手英偉達,共同推出了款創新的視覺語言模型——NaVILA。該模型機器人導航領域展現出了獨特的應用潛力,為智能機
    的頭像 發表于 12-13 10:51 ?611次閱讀

    大華股份榮獲2024年中國創新方法大賽等獎

    近日,由中國科協、重慶市人民政府舉辦的2024年中國創新方法大賽全國總決賽重慶落下帷幕。大華股份靈活運用創新方法、突破行業性技術難題,憑借“不懼強光,分毫必現,基于TRIZ的強逆光銳捕技術”項目,斬獲全國
    的頭像 發表于 12-04 17:19 ?682次閱讀

    基于視覺語言模型的導航框架VLMnav

    本文提出一種視覺語言模型(VLM)轉換為端到端導航策略的具體框架。不依賴于感知、規劃和控制之間的分離,而是使用VLM
    的頭像 發表于 11-22 09:42 ?718次閱讀

    利用全息技術硅晶圓內部制造納米結構的新方法

    本文介紹了一種利用全息技術硅晶圓內部制造納米結構的新方法。 研究人員提出一種硅晶圓內部制造
    的頭像 發表于 11-18 11:45 ?678次閱讀

    一種將NeRFs應用于視覺定位任務新方法

    視覺定位旨在估計已知環境中捕獲的給定圖像的旋轉和位置,大致可以分為絕對姿態回歸(APR),場景坐標回歸(SCR)和分層方法(HM)。
    的頭像 發表于 10-28 10:03 ?506次閱讀
    <b class='flag-5'>一種</b>將NeRFs應用于<b class='flag-5'>視覺</b>定位<b class='flag-5'>任務</b>的<b class='flag-5'>新方法</b>

    SLAM:機器人如何在未知地形環境中進行導航

    的傳統導航方法需要預先準備好的地圖,但在未知地區,如果不穿越該區域,就不可能獲得這樣的地圖。這是機器人技術領域的個典型難題,通常被稱為“雞和蛋”的問題。機器人如何在沒有地圖的情況下在
    的頭像 發表于 10-02 16:37 ?1301次閱讀

    一種完全分布式的點線協同視覺慣性導航系統

    本文中,我們提出一種完全分布式的點線協同視覺慣性導航系統。我們通過蒙特卡羅模擬和真實環境數據
    的頭像 發表于 09-30 14:45 ?804次閱讀
    <b class='flag-5'>一種</b>完全分布式的點線協同<b class='flag-5'>視覺</b>慣性<b class='flag-5'>導航</b>系統

    一種半動態環境中的定位方法

    和終身定位方法,以識別非靜態環境中的半動態物體,并提出個通用框架,將主流物體檢測算法與建圖和定位算法集成在起。建圖
    的頭像 發表于 09-30 14:40 ?507次閱讀
    <b class='flag-5'>一種</b>半動態<b class='flag-5'>環境</b>中的定位<b class='flag-5'>方法</b>

    保護4-20 mA,±20-mA模擬輸入的新方法

    電子發燒友網站提供《保護4-20 mA,±20-mA模擬輸入的新方法.pdf》資料免費下載
    發表于 09-24 09:27 ?0次下載
    保護4-20 mA,±20-mA模擬輸入的<b class='flag-5'>新方法</b>

    實踐JLink 7.62手動增加新MCU型號支持新方法

    大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家分享的是實踐JLink 7.62手動增加新MCU型號支持新方法
    的頭像 發表于 08-08 15:25 ?1237次閱讀
    實踐JLink 7.62手動增加新MCU型號支持<b class='flag-5'>新方法</b>

    一種無透鏡成像的新方法

    使用OAM-HHG EUV光束對高度周期性結構進行成像的EUV聚光顯微鏡 為了研究微電子或光子元件中的納米級圖案,一種基于無透鏡成像的新方法可以實現近乎完美的高分辨率顯微鏡。 層析成像是一種強大的無
    的頭像 發表于 07-19 06:20 ?692次閱讀
    <b class='flag-5'>一種</b>無透鏡成像的<b class='flag-5'>新方法</b>
    主站蜘蛛池模板: 国产精品免费视频能看 | 亚洲一区乱码电影在线 | 狠狠久久免费视频在线 | 成人在线免费视频观看 | 情欲.美女高潮 | 黄色三级图片 | 色综合99久久久国产AV | 国产真实夫妇交换视频 | 久久精品免视看国产 | 亚洲 欧美 国产 伦 综合 | 欧美xxxx印度 | 黑人娇小BBW| 欧美xxxx83d| 亚洲国产中文字幕在线视频 | 最近更新2019中文字幕国语 | 高冷师尊被CAO成SAO货 | 十二月综合缴缴情 | 手机观看毛片 | 免费在线观看一区 | 芭乐视频网页版在线观看 | 亚洲 自拍 清纯 综合图区 | 日本欧美午夜三级 | 陈红下面又紧又小好爽 | 十九岁在线观看免费完整版电影 | 拔萝卜在线高清观看视频 | 亚洲欧美激情精品一区二区 | 成人在线视频免费看 | 免费视频国产在线观看网站 | 在教室伦流澡到高潮HNP视频 | 同桌别揉我奶了嗯啊 | 久久国产乱子伦精品免费不卡 | 老熟女重囗味GRANNYBBW | 伦理在线影院伦理电影 | 91精品婷婷国产综合久久8 | 国产午夜亚洲精品理论片八戒 | 午夜国产精品影院在线观看 | 友田真希息与子中文字幕 | 美女漏bb | 午夜视频在线网站 | 9亚洲欧洲免费无码在线 | 91福利潘春春在线观看 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品