色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TLDR: 視頻分割一直是重標注的一個task,這篇CVPR 2023文章研究了完全不需要標注的視頻物體分割。

CVer ? 來源:CVer ? 2023-07-12 14:21 ? 次閱讀

TLDR: 視頻分割一直是重標注的一個task,這篇CVPR 2023文章研究了完全不需要標注的視頻物體分割。僅使用ResNet,RCF模型在DAVIS16/STv2/FBMS59上提升了7/9/5%。文章里還提出了不需要標注的調參方法。代碼已公開可用。

5a5d439a-2073-11ee-962d-dac502259ad0.png

Paper title: Bootstrapping Objectness from Videos by Relaxed Common Fate and Visual Grouping

arXiv: https://arxiv.org/abs/2304.08025

作者機構:UC Berkeley, MSRA, UMich

Project page: https://rcf-video.github.io/

Code and models: https://github.com/TonyLianLong/RCF-UnsupVideoSeg

視頻物體分割真的可以不需要人類監督嗎?

視頻分割一直是重標注的一個task,可是要標出每一幀上的物體是非常耗時費力的。然而人類可以輕松地分割移動的物體,而不需要知道它們是什么類別。為什么呢?

Gestalt定律嘗試解釋人類是怎么分割一個場景的,其中有一條定律叫做Common Fate,即移動速度相同的物體屬于同一類別。比如一個箱子從左邊被拖到右邊,箱子上的點是均勻運動的,人就會把這個部分給分割出來理解。然而人并不需要理解這是個箱子來做這個事情,而且就算是嬰兒之前沒有見過箱子也能知道這是一個物體。

5aca276c-2073-11ee-962d-dac502259ad0.png

運用Common Fate來分割視頻

這個定律啟發了基于運動的無監督分割。然而,Common Fate并不是物體性質的可靠指標:關節可動 (articulated) /可變形物體 (deformable objects) 的一些part可能不以相同速度移動,而物體的陰影/反射 (shadows/reflections) 始終隨物體移動,但并非其組成部分。

舉個例子,下面這個人的腿和身子的運動是不同的(Optical Flow可視化出來顏色不同)。這很常見,畢竟人有關節嘛 (articulated),要是這個處理不了的話,很多視頻都不能分割了。然而很多baseline是處理不了這點的(例如AMD+和OCLR),他們把人分割成了幾個部分。

5b2027ac-2073-11ee-962d-dac502259ad0.png

還有就是影子和反射,比如上面這只天鵝,它的倒影跟它的運動是一致的(Optical Flow可視化顏色一樣),所以之前的方法認為天鵝跟倒影是一個物體。很多視頻里是有這類現象的(畢竟大太陽下物體都有個影子嘛),如果這個處理不了的話,很多視頻也不能分割了。

那怎么解決?放松。Relax.

長話短說,那我們的方法是怎么解決這個問題的呢?無監督學習的一個特性是利用神經網絡自己內部的泛化和擬合能力進行學習。既然Common Fate有自己的問題,那么我們沒有必要強制神經網絡去擬合Common Fate。于是我們提出了Relaxed Common Fate,通過一個比較弱的學習方式讓神經網絡真正學到物體的特性而不是noise。

具體來說,我們的方法認為物體運動由兩部分組成:物體總體的piecewise-constant motion (也就是Common Fate)和物體內部的segment motion。比如你看下圖這個舞者,他全身的運動就可以被理解成piecewise-constant motion來建模,手部腿部這些運動就可以作為residual motion進行擬合,最后合并成一個完整的flow,跟RAFT生成的flow進行比較來算loss。我們用的RAFT是用合成數據(FlyingChairs和FlyingThings)進行訓練的,不需要人工標注。

5b4f6800-2073-11ee-962d-dac502259ad0.png

Relaxed Common Fate

首先我們使用一個backbone來進行特征提取,然后通過一個簡單的full-convolutional network獲得Predicted Masks $hat{M}$(下圖里的下半部分),和一般的分割框架是一樣的,也可以切換成別的框架。

那我們怎么優化這些Masks呢?我們先提取、合并兩幀的特征,放入一個residual flow prediction head來獲得Residual Flow $hat{R}$ (下圖里的上半部分)。

然后我們對RAFT獲得的Flow用Predicted Masks $hat{M}$進行Guided Pooling,獲得一個piecewise-constant flow,再加上預測的residual flow,就是我們的flow prediction了。最后把flow prediction和RAFT獲得的Flow的差算一個L1 norm Loss進行優化,以此來學習segmentation。

在測試的時候,只有Predicted Masks $hat{M}$ 是有用的,其他部分是不用的。

5b95f8f6-2073-11ee-962d-dac502259ad0.png

這里的Residual Flow會盡量初始化得小一些,來鼓勵先學piecewise-constant的部分(有點類似ControlNet),再慢慢學習residual部分。

引入Appearance信息來幫助無監督視頻分割

光是Relaxed Common Fate就能在DAVIS上相對baseline提5%了,但這還不夠。前面說Relaxed Common Fate的只用了motion而沒有使用appearance信息。

讓我們再次回到上面這個例子。這個舞者的手和身子是一個顏色,然而AMD+直接把舞者的手忽略了。下面這只天鵝和倒影明明在appearance上差別這么大,卻在motion上沒什么差別。如果整合appearance和motion,是不是能提升分割質量呢?

5bb4182c-2073-11ee-962d-dac502259ad0.png

因此我們引入了Appearance 來進行進一步的監督。在學習完motion信息之后,我們直接把取得的Mask進行兩步優化:一個是low-level的CRF refinement,強調顏色等細節一致的地方應該屬于同一個mask(或背景),一個是semantic constraint,強調Unsupervised Feature一直的地方應該屬于同一個mask。

把優化完的mask再和原mask進行比較,計算L2 Loss,再更新神經網絡。這樣訓練的模型的無監督分割能力可以進一步提升。具體細節歡迎閱讀原文。

5bf4316e-2073-11ee-962d-dac502259ad0.png

無監督調參

很多無監督方法都需要使用有標注的數據集來調參,而我們的方法提出可以利用前面說的motion和appearance的一致性來進行調參。簡單地說,motion學習出的mask在appearance上不一致代表這個參數可能不是最優的。具體方法是在Unsupervised Feature上計算Normalized Cuts (但是不用算出最優值),Normalized Cuts越小越代表分割效果好。原文里面對此有詳細描述。

方法效果

無論是否有Post-processing,我們的方法在三個視頻分割數據集上都有很大提升,在STv2上更是提升了12%。

5c19869e-2073-11ee-962d-dac502259ad0.png

Ablation可以看出Residual pathway (Relaxed Common Fate)的貢獻是最大的,其他部分總計貢獻了11.9%的增長。

5c2ed2ba-2073-11ee-962d-dac502259ad0.png

Visualizations

5c55c0dc-2073-11ee-962d-dac502259ad0.png

5db3ac5a-2073-11ee-962d-dac502259ad0.png

總結

這篇CVPR 2023文章研究了完全不需要標注的視頻物體分割。通過Relaxed Common Fate來利用motion信息,再通過改進和利用appearance信息來進一步優化,RCF模型在DAVIS16/STv2/FBMS59上提升了7/9/5%。文章里還提出了不需要標注的調參方法。代碼和模型已公開可用。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4772

    瀏覽量

    100838
  • 視頻分割
    +關注

    關注

    0

    文章

    4

    瀏覽量

    5805

原文標題:TLDR: 視頻分割一直是重標注的一個task,這篇CVPR 2023文章研究了完全不需要標注的視頻物體分割。

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI自動圖像標注工具SpeedDP將是數據標注行業發展的重要引擎

    AI大浪潮下,許多企業都在不斷借助AI來提升自己的行業競爭力,數據標注企業也不例外,傳統人工標注效率不足的弊端困擾多年,如今新的“引擎”就在眼前,他們當然不會放過這個機會。針對這樣的需求,慧視光電
    的頭像 發表于 01-02 17:53 ?91次閱讀
    AI自動圖像<b class='flag-5'>標注</b>工具SpeedDP將是數據<b class='flag-5'>標注</b>行業發展的重要引擎

    想找AGC的芯片,不需要軟件控制的 ,完全硬件AGC,求推薦

    想找AGC的芯片完全硬件AGC不需要軟件控制的價格20元以下
    發表于 10-28 06:21

    四畫面分割器怎么調分辨率

    四畫面分割器(Quad Screen Splitter)是視頻處理設備,它能夠將四視頻信號源合并到
    的頭像 發表于 10-17 09:35 ?452次閱讀

    畫面分割器怎么調試

    畫面分割器,通常指的是視頻畫面分割器,它是種可以將視頻
    的頭像 發表于 10-17 09:32 ?424次閱讀

    畫面分割器怎么連接

    器的基本原理 畫面分割器的工作原理是通過數字信號處理技術,將多個視頻信號源(如攝像頭、DVR等)的圖像數據進行處理,然后在監視器上以分割
    的頭像 發表于 10-17 09:29 ?332次閱讀

    畫面分割器和視頻分配器有何區別

    畫面分割器和視頻分配器是兩種不同的視頻處理設備,它們在視頻監控系統中扮演著不同的角色。 1. 畫面分割器 畫面
    的頭像 發表于 10-17 09:27 ?458次閱讀

    畫面分割器和分屏器有什么區別

    畫面分割器和分屏器是兩種在視頻處理領域常見的設備,它們的主要功能是將多個視頻信號合并到顯示設備上。盡管它們的功能相似,但在技術實現、應用
    的頭像 發表于 10-17 09:25 ?504次閱讀

    畫面分割器有幾路主輸出

    畫面分割器,也稱為視頻分割器或多畫面處理器,是種可以將
    的頭像 發表于 10-17 09:24 ?354次閱讀

    畫面分割器的主要功能

    畫面分割器,也稱為視頻分割器或多畫面分割器,是種用于將多個視頻信號整合到
    的頭像 發表于 10-17 09:22 ?663次閱讀

    圖像分割和語義分割的區別與聯系

    、亮度等。圖像分割的目的是將圖像中感興趣的部分與背景分離,以便進行進步的處理和分析。 1.1 圖像分割的類型 圖像分割可以分為以下幾類: 基于閾值的
    的頭像 發表于 07-17 09:55 ?1012次閱讀

    圖像分割與語義分割中的CNN模型綜述

    圖像分割與語義分割是計算機視覺領域的重要任務,旨在將圖像劃分為多個具有特定語義含義的區域或對象。卷積神經網絡(CNN)作為深度學習的種核心模型,在圖像分割與語義
    的頭像 發表于 07-09 11:51 ?959次閱讀

    機器人視覺技術中常見的圖像分割方法

    機器人視覺技術中的圖像分割方法是廣泛且深入的研究領域。圖像分割是將圖像劃分為多個區域或對象的過程,這些區域或對象具有某種共同的特征,如顏
    的頭像 發表于 07-09 09:31 ?742次閱讀

    機器人視覺技術中圖像分割方法有哪些

    機器人視覺技術是人工智能領域的重要分支,它涉及到圖像處理、模式識別、機器學習等多個學科。圖像分割是機器人視覺技術中的重要環節,它的目
    的頭像 發表于 07-04 11:34 ?1032次閱讀

    一直在調pmsm無速度的仿真,但是波形總是不對是為什么?

    ,換個參數就是封頂別的數值了)。給定速度超過900,轉速就一直是900;給定速度低于900,電機轉速就變負的。。這是為什么啊?速度完全不跟隨給定
    發表于 02-06 06:49

    PCB信號跨分割需要怎么處理?

    在PCB設計過程中,電源平面的分割或者是地平面的分割,會導致平面的不完整,這樣信號走線的時候,它的參考平面就會出現從電源面跨接到另一個
    發表于 01-10 15:28 ?1059次閱讀
    PCB信號跨<b class='flag-5'>分割</b>線<b class='flag-5'>需要</b>怎么處理?
    主站蜘蛛池模板: 成人无码在线超碰视频| 国产又色又爽又刺激在线播放| 最新国产成人综合在线观看| 一区三区三区不卡| 在线视频 国产精品 中文字幕| 在线观看永久免费网址| 中国二级毛片| adc年龄确认大驾光临入口| 扒开老师大腿猛进AAA片软件| 百性阁综合社区| 国产精品XXXXX免费A片| 国产婷婷午夜精品无码A片| 九九色精品国偷自产视频| 快播电影频道| 秋霞伦理机在线看片| 我和妽妽在厨房里的激情区二区| 亚洲国产在线精品国自产拍五月| 一级毛片免费下载| 99热久久这里只精品国产WWW| 成人在线视频国产| 国产在线播放KKK| 毛片免费大全| 日本免费xxx| 亚洲第一免费播放区| 中文字幕亚洲第一页| 成年人视频在线免费观看| 国产乱码伦人偷精品视频| 久久久久嫩草影院精品| 欧美夜夜噜2017最新| 吸奶舔下面| 最近的中文字幕2019国语| 床伴在线观看免费高清完整泰剧第四集 | ai换脸女明星被躁在线观看免费| 二色AV天堂在线| 久久99AV无色码人妻蜜柚| 欧美午夜免费观看福利片| 性派对xxxhd| 99RE久久精品国产| 国产欧美一区二区精品性色tv| 菊地凛子av| 无码精品AV久久久奶水|