色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

你的DragGAN并不需要點跟蹤!中科大和上海AI Lab提出FreeDrag:無需點跟蹤即可穩(wěn)定拖動語義內(nèi)容

CVer ? 來源:CVer ? 2023-07-13 14:36 ? 次閱讀

近日,在AIGC的廣闊世界里出現(xiàn)了一個火熱的圖像編輯方法—即通過在給定圖像上通過把語義內(nèi)容從原位置(handle point)拖動到目標位置(target point)的方式進行精細的定制化編輯操作。比如令人印象深刻的讓你家貓咪對你wink的神奇操作:

4957bb74-213c-11ee-962d-dac502259ad0.gif

這一驚人效果來自于發(fā)表在SIGGRAPH 2023會議上的 [Drag Your GAN] 論文(簡稱為DragGAN)。并且DragGAN的代碼一經(jīng)發(fā)出就在短短幾周內(nèi)狂攬30K star,引發(fā)廣大網(wǎng)友的“Drag”熱潮。有了DragGAN的加持,各種AI畫圖工具的「阿喀琉斯之踵」再也不是弱點,哪里不滿意就只修哪里!

499056c8-213c-11ee-962d-dac502259ad0.png

圖 1 DragGAN 由于內(nèi)容突變發(fā)生跟蹤點丟失

近日,中科大和上海AI Lab的研究者們又發(fā)布了一項相關研究—FreeDrag。研究者們表明,先前的DragGAN由兩個交替迭代進行的過程構成:(1)運動監(jiān)督(motion supervision)過程指導handle point向著對應的target point進行移動;(2)點跟蹤(point tracking)過程則負責定位移動后handle point的精確位置從而為下次移動提供方向和約束特征。因此DragGAN 嚴重依賴于點跟蹤的精確性。然而,點跟蹤的策略本質(zhì)上是不穩(wěn)定的,因為它隱式地假設每次移動后在默認的搜索區(qū)域內(nèi)有且僅有一個點完美繼承了handle point的特征。這個假設會在以下兩種情況下失效:i) 圖像內(nèi)容發(fā)生劇烈變化導致的跟蹤丟失(圖1) ii) 搜索區(qū)域內(nèi)的相似點導致的跟蹤錯誤(圖2),例如輪廓線和馬腿等。錯誤的點跟蹤會為下一次移動提供錯誤的方向和約束特征,造成誤差累積從而損害編輯的質(zhì)量。

49e8ad96-213c-11ee-962d-dac502259ad0.png

圖 1 DragGAN 由于相似點的存在發(fā)生錯誤的點跟蹤

方法介紹

為了防止不穩(wěn)定的點跟蹤過程不可避免地損害圖像編輯的質(zhì)量,中國科學技術大學和上海AI Lab的研究者們共同提出FreeDrag, 一種以特征為導向的基于點的交互式編輯框架。FreeDrag通過引入自適應更新的模板特征,模糊定位和線性搜索技術,在無需進行精確點跟蹤的情況下即可實現(xiàn)更加穩(wěn)定可靠的拖動編輯。

4a36d854-213c-11ee-962d-dac502259ad0.png

圖 2 FreeDrag 的流程圖

4a603474-213c-11ee-962d-dac502259ad0.png

圖 3 DragGAN的點跟蹤和FreeDrag 點定位的比較。

DragGAN 要求精確定位4a77ee16-213c-11ee-962d-dac502259ad0.png的位置,而FreeDrag 通過約束特征差異限制定位點4a871d96-213c-11ee-962d-dac502259ad0.png4a77ee16-213c-11ee-962d-dac502259ad0.png附近,但不要求確定4a77ee16-213c-11ee-962d-dac502259ad0.png的具體位置。

動態(tài)更新的模板特征

4ab0008a-213c-11ee-962d-dac502259ad0.png

研究者們首先提出了動態(tài)更新的模板特征技術來緩解跟蹤點丟失問題。模板特征通過衡量每次移動的質(zhì)量來決定是否更新,即通過控制4abf0788-213c-11ee-962d-dac502259ad0.png的值來決定每次更新的比例。更大的4abf0788-213c-11ee-962d-dac502259ad0.png意味著更大的更新程度。移動質(zhì)量越高更新程度越大。移動質(zhì)量通過衡量移動結(jié)束后4a871d96-213c-11ee-962d-dac502259ad0.png處的特征4ae36cc2-213c-11ee-962d-dac502259ad0.png和上一次的模板特征值4af1ec7a-213c-11ee-962d-dac502259ad0.png的?????? L1 距離 (4b01fc32-213c-11ee-962d-dac502259ad0.png) 來度量,4b01fc32-213c-11ee-962d-dac502259ad0.png越小說明移動質(zhì)量越高。模板特征的更新過程不依賴于handle point 的位置和特征,從而擺脫了對精確的點跟蹤的負擔,同時自適應的更新策略帶來的平滑性賦予了模板特征更好的魯棒性來克服劇烈的內(nèi)容變化,避免編輯內(nèi)容的異常丟失。

模糊定位和線性搜索

緊接著,研究者們提出模糊定位和線性搜索技術來緩解跟蹤點模糊問題。FreeDrag 通過移動距離4b1d6f30-213c-11ee-962d-dac502259ad0.png和特征差異4b2e4c10-213c-11ee-962d-dac502259ad0.png來為每次的移動定位適合的目標點,即公式(10)。定位主要分為三種情況:繼續(xù)向target point移動(移動質(zhì)量高);保持當前位置不動(移動不徹底),點回退(移動異常)。

4b3d9d96-213c-11ee-962d-dac502259ad0.png

相比于DragGAN要求的精確的點跟蹤,公式(10)搜尋的定位點是“模糊”因為它并不要求搜尋handle point的準確位置,而是通過約束特征差異確保定位點在handle point附近, 因此擺脫了精確定位的負擔。此外,公式(10) 只在原始handle point 和 target point 形成的直線上進行點搜索,這種線性搜索策略有效地緩解了相鄰區(qū)域內(nèi)相似點的干擾,保障了運動監(jiān)督的可靠性,進一步提高點移動的穩(wěn)定性。

實驗對比

DragGAN 和 FreeDrag 在各類場景上的對比如下圖(圖4)所示,可以發(fā)現(xiàn)FreeDrag可以有效地防止handle point的異常消失(如圖4第一個例子中消失的嘴巴和第二個例子中消失的眼鏡),同時有力地避免了由于內(nèi)容突變和相似點干擾導致的異常編輯,保障了點移動的可靠性(如圖4第三個例子中大象的眼睛和第四個例子中的馬腿)。此外,從圖4的(5)-(8)例子可以觀察到FreeDrag 可以通過穩(wěn)定的點移動更有效更精確地實現(xiàn)預定的編輯目標。進一步的,在各類場景上的大量實驗(圖5) 充分驗證了FreeDrag 可以通過穩(wěn)定的點移動實現(xiàn)更高的編輯質(zhì)量,助力交互式的基于點的圖像編輯達到新的高度。

4b57b8ca-213c-11ee-962d-dac502259ad0.png

圖 4 DragGAN 和 FreeDrag 在各類場景上的對比圖

4bb0c122-213c-11ee-962d-dac502259ad0.png

圖 5 DragGAN 和 FreeDrag 在更多場景下的對比圖

視頻對比如下:

左邊兩張圖分別為原始圖片和編輯目標(紅色為handle point, 藍色為target point)

右邊分別為為DragGAN 和FreeDrag的處理過程(gif)

4cf50d7c-213c-11ee-962d-dac502259ad0.png

對于拖動大象眼睛的例子,可以觀察到,DragGAN 在移動大象眼睛的過程中發(fā)生了圖像布局的突變造成點跟蹤丟失,點跟蹤丟失導致無法為之后的運動提供有效的運動監(jiān)督,進而無法實現(xiàn)預定的編輯目的。相比而言,得益于動態(tài)更新的模板特征的平滑性,F(xiàn)reeDrag 可以更好地避免圖像內(nèi)容的急劇變化,從而更可靠地將眼部特征拖向預定的位置。

對于拖動馬腿的例子,可以觀察到, DragGAN在移動馬腿過程中發(fā)生了錯誤的點跟蹤,從而為之后的運動監(jiān)督提供了錯誤的優(yōu)化方向,進而降低了圖像質(zhì)量,這種錯誤會在多次迭代中累計導致編輯結(jié)果質(zhì)量的急劇下降。相比而言, FreeDrag 的模糊定位和線性搜索策略有效地緩解了相似點的干擾,為點移動提供了可靠的監(jiān)督信號,從而高質(zhì)量地實現(xiàn)預定的編輯目的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1087

    瀏覽量

    40499
  • 代碼
    +關注

    關注

    30

    文章

    4801

    瀏覽量

    68735
  • AIGC
    +關注

    關注

    1

    文章

    363

    瀏覽量

    1559

原文標題:你的DragGAN并不需要點跟蹤!中科大和上海AI Lab提出FreeDrag:無需點跟蹤即可穩(wěn)定拖動語義內(nèi)容

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    中科大人口模型講義

    中科大人口模型講義[hide] [/hide]
    發(fā)表于 09-15 12:01

    微機原理與接口技術 中科大教材

    微機原理與接口技術 中科大教材[/hide]
    發(fā)表于 12-07 11:15

    中科大發(fā)的論文《新一代TSC2046觸摸屏控制器》

    中科大發(fā)的論文《新一代TSC2046觸摸屏控制器》
    發(fā)表于 08-03 08:12

    51單片機C語言編程入門(中科大)

    51單片機C語言編程入門(中科大)
    發(fā)表于 08-06 12:20

    中科大嵌入式課件全集

    本帖最后由 eehome 于 2013-1-5 09:46 編輯 中科大嵌入式課件全集
    發(fā)表于 08-14 21:52

    溷沌數(shù)字通信(中科大出版的)

    溷沌數(shù)字通信(中科大出版的)
    發(fā)表于 08-16 16:49

    光電信號處理!!!(何兆湘 華中科大)

    光電信號處理!!!(何兆湘 華中科大)
    發(fā)表于 08-16 19:47

    51單片機C語言編程入門(中科大)

    51單片機C語言編程入門(中科大)
    發(fā)表于 08-17 16:02

    51單片機資料(中科大

    51單片機資料(中科大),超高新掃描版,上傳給初學者{:7:}
    發(fā)表于 06-23 12:51

    中科院中科大2003年量子力學考研試題答案

    中科院—中科大2003年量子力學考研試題答案
    發(fā)表于 11-25 16:05 ?0次下載
    <b class='flag-5'>中科院中科大</b>2003年量子力學考研試題答案

    人口模型講義 (中科大課程)

    人口模型課件 (中科大課程講義)
    發(fā)表于 09-15 11:59 ?24次下載

    AMD高管表示,我們的32核Threadripper處理器只需要風冷散熱即可并不需要水冷機

    要的是英特爾因為使用了冷水機給處理器超頻而被玩家質(zhì)疑。對于這一,AMD高管在E3直播活動上有意無意地指出他們家的32核Threadripper處理器只需要風冷散熱即可并不需要水冷機
    發(fā)表于 06-14 11:28 ?1624次閱讀

    《日本經(jīng)濟新聞》報道:中科大為何能對中國AI領域產(chǎn)生很的影響?

    近日,《日本經(jīng)濟新聞》的一則報道指出:在左右著企業(yè)、國家和地區(qū)發(fā)展的人工智能領域,中科大少年班的人才支撐著中國的發(fā)展。中國自動駕駛公司百度的總裁張亞勤、前阿里云人工智能首席科學家的閔萬里、AI芯片
    的頭像 發(fā)表于 07-18 09:40 ?7533次閱讀

    在醫(yī)療AI領域砥礪前行的中科大學子

    作為國字號的科研基石,中科大依靠學術層面的踏實耕耘,很大程度上影響了中國的醫(yī)療科技風向。 談論一所大學撐起一個城市的代表,中科大和合肥的CP組合,一定榜上有名。 在合肥的“大湖名城 創(chuàng)新高地”立城
    的頭像 發(fā)表于 05-10 09:36 ?4927次閱讀

    不需要點表的工業(yè)網(wǎng)關應用案例:如何提升工業(yè)企業(yè)生產(chǎn)效率與質(zhì)量?

    不需要點表的工業(yè)網(wǎng)關解決方案。技術團隊在車間各個關鍵設備節(jié)點安裝了新的工業(yè)網(wǎng)關。由于不需要點表,安裝過程極為簡便,技術人員僅需將網(wǎng)關與設備連接,并進行簡單的網(wǎng)絡設置,即可完成部署。整個車間的網(wǎng)關部署時間比之前預計縮短了 [X]%
    的頭像 發(fā)表于 11-13 10:27 ?162次閱讀
    <b class='flag-5'>不需要點</b>表的工業(yè)網(wǎng)關應用案例:如何提升工業(yè)企業(yè)生產(chǎn)效率與質(zhì)量?
    主站蜘蛛池模板: 小草高清视频免费直播| 久久er99热精品一区二区| WWW污污污抽搐喷潮COM| 精品手机在线1卡二卡3卡四卡| 色偷偷综合网| 香艳69xxxxx有声小说| 成年无码av片| 欧美性暴力变态xxxx| 国产乱对白精彩在线播放 | 成年人免费观看的视频| 久久视频这只精品99re6| 暖暖的高清视频在线观看免费中文| 亚洲精品视频免费在线观看| 国产露脸150部国语对白| 午夜DV内射一区区| 国产日韩欧美三级| 亚洲精品久久久久一区二区三| 国产亚洲精品久久久久久国模美 | 国产精品免费视频播放| 晚夜免费禁用十大亏亏| 中文字幕亚洲乱码熟女在线萌芽| 国产欧美在线亚洲一区刘亦菲| 午夜勾魂曲| 黄色毛片a| 午夜阳光影院在线观看视频| 国产AV国片精品无套内谢无码| 久久久久亚洲| 一本道久在线综合道| 京香在线观看| 最新中文字幕在线视频| 欧美成人国产| 国产高清免费观看| 亚洲免费精品视频| 久久亚洲国产精品亚洲| 99热在线视频| 色狼亚洲色图| 国内国外精品影片无人区| 在线视频a| 久久视热频国产这里只有精品23 | 免费在线视频一区| VIDEOSGGRATIS欧美另类|