色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

VISPROG:以神經符號方式將人工智能推向更廣泛、更復雜的任務領域

CVer ? 來源:AI Around ? 2023-07-10 15:26 ? 次閱讀

本文將為大家介紹CVPR 2023年最佳論文兩篇中的Visual Programming: Compositional visual reasoning without training (視覺編程:無需訓練的組合式視覺推理),代碼已開源。

16ef7da6-1ec7-11ee-962d-dac502259ad0.png

Title:

VisualProgramming:Compositionalvisualreasoningwithouttraining

Paper:

https://openaccess.thecvf.com/content/CVPR2023/html/Gupta_Visual_Programming_Compositional_Visual_Reasoning_Without_Training_CVPR_2023_paper.html

Code:

https://github.com/allenai/visprog

01

/導讀/

VISPROG是一種神經符號方法,可利用自然語言指令解決復雜的組合式視覺任務。VISPROG避免了任何特定于任務的訓練需求。相反,它利用大型語言模型的上下文學習能力生成類似Python的可組合程序,這些程序將被執行以獲得解決方案和全面可解釋的推理結果。生成的程序的每一行可以調用多個現成的計算機視覺模型、圖像處理子程序或Python函數以生成中間輸出,后續程序部分可以使用這些中間輸出。在四項不同的任務中展示了VISPROG的靈活性:組合式視覺問答、基于圖像對的零樣本推理、實際知識對象標注和語言引導圖像編輯。類似VISPROG這樣的神經符號方法是擴展人工智能系統范圍、為人們提供執行復雜任務的有效途徑。

1710c09c-1ec7-11ee-962d-dac502259ad0.png

VISPROG是一種可組合和可解釋的神經符號系統,用于進行組合式視覺推理。給定自然語言指令和高層次程序的幾個示例,VISPROG利用GPT-3的上下文學習功能針對任何新指令生成程序,并在輸入的圖像上執行程序以獲取預測結果。VISPROG還將中間輸出總結為可以解釋的視覺說明。

02

/模塊/

VisProg目前支持20個模塊,可實現圖像理解、圖像操作(包括生成)、知識檢索和算術和邏輯操作等能力。在這里顯示的紅色模塊是使用經過訓練的最先進神經模型實現的,而藍色模塊是使用多種Python庫(如PIL、OpenCV和AugLy)實現的非神經Python函數。

174af37a-1ec7-11ee-962d-dac502259ad0.png

在VISPROG中,每個模塊都被實現為一個Python類,見下述代碼,其具有以下方法:

(i)解析行以提取輸入參數的名稱和值以及輸出變量的名稱;

(ii)執行必要的計算,可能涉及訓練過的神經模型,并更新程序狀態以獲得輸出變量的名稱和值;

(iii)使用HTML方式以可視方式總結該步驟的計算(用于創建visual rationales)。

要向VISPROG添加新模塊,只需要實現并注冊一個模塊類,程序的執行使用該模塊將由VISPROG解釋器自動處理。

1774fae4-1ec7-11ee-962d-dac502259ad0.png

03

/VISPROG中的程序生成/

VisProg通過向LLM GPT-3提供指令及其相關的示例指令和對應程序,來生成程序。與以前的方法如神經模塊網絡(Neural Module Network)不同,VisProg利用大規模語言模型的上下文學習能力來生成程序,而不是使用預先定義的模塊。這使生成的程序更加靈活且能夠處理更多的組合式視覺任務。

179e0772-1ec7-11ee-962d-dac502259ad0.png

04

/可解釋性/

VisProg不僅生成高度可解釋的程序,還通過將每個步驟的輸入和輸出的摘要拼接在一起生成visual rationales,以幫助理解和調試程序執行期間的信息流。下面是兩個visual rationales的示例。

使用自然語言進行圖像編輯

17fd64f6-1ec7-11ee-962d-dac502259ad0.png

關于圖像對的推理(自然語言視覺推理)

1867dd7c-1ec7-11ee-962d-dac502259ad0.png

04

/結果可視化/

在組合式視覺問答、基于零樣本的圖像對推理(僅使用單張圖像VQA模型)、實際知識對象標記和語言引導的圖像編輯等復雜視覺任務上展示了VisProg。下圖展示了VisProg在對象標記和圖像編輯任務上的能力。

1895ef0a-1ec7-11ee-962d-dac502259ad0.png

更多關于所有任務的定性結果以及相應的視覺說明,包括由于程序生成中的邏輯錯誤或模塊預測錯誤而導致的失敗案例,請根據下面鏈接下載查閱:

https://openaccess.thecvf.com/content/CVPR2023/supplemental/Gupta_Visual_Programming_Compositional_CVPR_2023_supplemental.zip

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模塊
    +關注

    關注

    7

    文章

    2716

    瀏覽量

    47522
  • 人工智能
    +關注

    關注

    1791

    文章

    47350

    瀏覽量

    238734
  • python
    +關注

    關注

    56

    文章

    4797

    瀏覽量

    84744

原文標題:CVPR 2023 最佳論文!VISPROG:以神經符號方式將人工智能推向更廣泛、更復雜的任務領域

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    嵌入式和人工智能究竟是什么關系?

    嵌入式和人工智能究竟是什么關系? 嵌入式系統是一種特殊的系統,它通常被嵌入到其他設備或機器中,實現特定功能。嵌入式系統具有非常強的適應性和靈活性,能夠根據用戶需求進行定制化設計。它廣泛應用于各種
    發表于 11-14 16:39

    未來的人工智能技術趨勢是什么?

    隨著Google、Microsoft和Facebook等巨頭的大力投入,深度學習正在超越機器學習,人工智能來勢兇猛。那么,如今人工智能最熱門的技術趨勢是什么?黑匣認為,復雜神經網絡、L
    發表于 12-23 14:21

    人工智能事實上是一種生物進化歷程的壓縮

    ,執行化合生命體無法執行的或復雜或規模龐大的任務等等。值得一提的是,機器翻譯是人工智能的重要分支和最先應用領域。不過就已有的機譯成就來看,機譯系統的譯文質量離終極目標仍相差甚遠;而機譯
    發表于 03-08 10:56

    百度總裁:百度在人工智能領域已有重大突破

      隨著阿法狗大戰李世石,人工智能引發越來越多的關注。百度總裁張亞勤28日表示,百度長期堅持技術創新,2015年研發投入超過100億元,目前在人工智能領域已有重大突破?! 垇喦谠谔旖蛳募具_沃斯論壇
    發表于 07-01 15:22

    人工智能已經進入醫療領域

    方式保存起來,當需要的時候在一定的授權下能夠很快的調回使用,同時增加一些輔助診斷管理功能。如今,隨著人工智能技術的逐步興起,為放射科醫生提高工作效率提供了更多可能。通過人工智能算法,機器可以自動讀取
    發表于 05-24 15:07

    人工智能到底用 GPU?還是用 FPGA?

    `我思故我在 亮出你的觀點自從類神經網絡算法可以用強大的運算能力加以模擬之后,強人工智能才開始出現。即便如此,目前 CPU 的運算能力來講,模擬類神經網絡算法的代價非常之大,于是有人
    發表于 08-23 15:42

    人工智能和機器學習的前世今生

    可以交替使用的概念,這或多或少地加重了與這些概念相關聯的已經存在的混淆程度。讓我們領會這些概念,直截了當地理解它們的內涵和之間的細微差別。人工智能是一個比機器學習更廣泛的概念。它是關于人類的認知
    發表于 08-27 10:16

    全語音人工智能AI耳機,或引爆智能耳機市場

    ,阿里巴巴集團董事局主席馬云人工智能重新定義為:未來的一種生活方式人工智能正在改變一切,在未來將會顛覆所有的商業應用,影響每一個人的生活。那么,當
    發表于 11-02 11:55

    人工智能:超越炒作

    。對于人工智能用例在當前物聯網環境中變為現實,必須滿足三個條件:非常大的真實數據集具有重要處理能力的硬件架構和環境開發新的強大算法和人工神經網絡(ANN)充分利用上述內容很明顯,后兩
    發表于 05-29 10:46

    人工智能后續什么形式發展?

    從2014年開始,人工智能逐漸成為科技領域最熱門的概念,被科技界,企業界和媒體廣泛關注。作為一個學術領域,人工智能是在1956年夏季,
    發表于 08-12 07:53

    人工智能的應用領域有哪些?

    ` 本帖最后由 cdhqyj 于 2020-10-23 11:09 編輯 人工智能的應用領域有哪些?人工智能的定義可以分為兩部分,即“人工”和“
    發表于 10-23 11:07

    中國人工智能的現狀與未來

    中國人工智能的現狀與未來,人工智能是目前最火熱的技術領域,也是一門極富挑戰性的科學,從事這項工作的人必須懂得計算機知識,數學、心理學,甚至哲學。人工智能是包括十分
    發表于 07-27 06:40

    什么是人工智能、機器學習、深度學習和自然語言處理?

    ,機器人現在可以與具有多任務處理能力的人類工作者一起工作。計算機視覺、傳感器網絡和人工智能廣泛應用于數控機床和裝配線,減少誤差,實現自動修正和提高生產率。交通: 基于應用程序的出租車
    發表于 03-22 11:19

    《移動終端人工智能技術與應用開發》人工智能的發展與AI技術的進步

    人工智能打發展是算法優先于實際應用。近幾年隨著人工智能的不斷普及,許多深度學習算法涌現,從最初的卷積神經網絡(CNN)到機器學習算法的時代。由于應用環境的差別衍生出不同的學習算法:線性回歸,分類與回歸樹
    發表于 02-17 11:00

    神經符號人工智能如何書寫未來

    符號人工智能神經網絡還是完完全全的兩個世界,相互對立。人工智能領域的大佬們常常各執一詞,在支持一種方法的同時,必將否定另一種方法。
    發表于 01-07 13:38 ?2216次閱讀
    主站蜘蛛池模板: 十九岁韩国电影在线观看| 中文字幕按摩| 大香交伊人| 色欲AV精品一区二区入口| 国产成人在线播放| 亚洲国产欧美日本大妈| 久久伊人影视| 成人免费观看国产高清| 亚洲AV无码国产精品色午夜情| 精品一区二区免费视频蜜桃网| 97欧美精品大香伊蕉在人线| 全免费A敌肛交毛片免费懂色AV| 高潮久久久久久久久不卡| 亚洲AV午夜精品麻豆AV| 麻豆国产人妻欲求不满| 成人小视频在线观看| 亚洲黄色片免费看| 蜜柚视频高清在线| 国产成人无码区免费内射一片色欲| 亚洲精品天堂自在久久77| 六六影院午夜伦理| 国产精品大陆在线视频| 中文字幕中文字幕永久免费| 色姊姊真舒服| 恋夜秀场1234手机视频在线观看| 成3d漫二区三区四区| 亚洲永久免费视频| 热99RE久久精品国产| 黑色丝袜美女被网站| SAO货腿张开JI巴CAO死我| 亚洲成年人免费网站| 欧美高清videossexo| 饥渴的新婚女教师| 动漫美女搞鸡| 5G年龄确认我已满18免费| 小莹的性荡生活| 青青国产在线观看视频| 久久草这在线观看免费| 国产叼嘿久久精品久久| chinesetoilet美女沟| 伊人久久网站|