色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

一種新的分割模型Stable-SAM

0. 筆者個人體會

分割一切模型（SAM）這幾年在CV領域應用很多，很多文章都在努力提高SAM的分割精度，但SAM分割的前提是高質量的提示（點、框）。但是實踐中的SAM經(jīng)常遇到不準確的提示，尤其是眾包標注平臺，這種不準確的提示會導致分割錯誤。

這也就是Stable Segment Anything Model這篇文章想要解決的問題，提出了一種新的分割模型Stable-SAM，希望遇到錯誤提示時也能實現(xiàn)穩(wěn)定分割！

1. 效果展示

SAM、HQ-SAM、Stable-SAM在提供次優(yōu)提示時的性能比較，Stable-SAM明顯優(yōu)于其他算法。

SAM和Stable-SAM的預測Mask和圖像特征的權重對比，橙色圓圈表示注意力權重，半徑越大表示得分越高。(a) 當提供高質量提示時，SAM分割結果很好。(b) 微小的提示修改會導致不穩(wěn)定的分割輸出，SAM錯誤分割了背景。(c) Stable-SAM通過將更多的特征采樣注意力轉移到目標對象上來準確地分割目標對象。

2. 具體原理是什么？

Stable-SAM的具體pipeline由三部分組成：

(a)是SAM的Mask解碼器中的可變形采樣插件(DSP)和可變形路由插件(DRP)。DSP采用小偏移網(wǎng)絡(b)來預測特征采樣偏移。隨后DSP在更新的采樣位置對可變形圖像特征進行重新采樣，并將它們饋送到SAM的標記到圖像注意力。DRP采用一個小型MLP網(wǎng)絡(c)來根據(jù)輸入提示質量調節(jié)DSP激活的程度。注意，DSP自適應地單獨調整圖像特征采樣位置，不會改變原始SAM模型。

3. 和其他SOTA方法對比如何？

在不同質量的提示下，SAM、DT-SAM(微調SAM的Mask解碼器)、PT-SAM(微調SAM的提示token及其對應的輸出MLP層)、HQ-SAM和Stable-SAM在HQ數(shù)據(jù)集上的對比。這里也推薦工坊推出的新課程《如何將深度學習模型部署到實際工程中？（分類+檢測+分割）》。

MS COCO和SGinW數(shù)據(jù)集上的對比，Stable-SAM最優(yōu)。

審核編輯：黃飛

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

dsp

dsp

+關注

關注
553

文章
7987

瀏覽量
348757
解碼器

解碼器

+關注

關注
9

文章
1143

瀏覽量
40718
圖像分割

圖像分割

+關注

關注
4

文章
182

瀏覽量
17995
SAM

SAM

+關注

關注
0

文章
112

瀏覽量
33519

原文標題：SAM終結者：穩(wěn)定分割一切！

文章出處：【微信號：3D視覺工坊，微信公眾號：3D視覺工坊】歡迎添加關注！文章轉載請注明出處。

一種帶驗證的自適應鏡頭分割算法

：文中針對鏡頭分割在基于內容的視頻檢索中的重要性，首先介紹了普通的鏡頭分割方法，進而針對這些方法的不足，提出了一種帶檢測的自適應鏡頭分割算法，該方法能夠檢測

發(fā)表于 12-16 12:25 ?21次下載

一種目標飛機分割提取方法

提出了一種目標飛機分割提取方法，該方法采用改進的使用金字塔式分割策略的以彩色高斯混合模型CMM（Gaussian Mixture Model）和迭代能量最小化為基礎的CJrabCut算

發(fā)表于 11-10 15:46 ?7次下載

<b class='flag-5'>一種</b>目標飛機<b class='flag-5'>分割</b>提取方法

一種新的彩色圖像分割算法

本文提出一種新的結合分水嶺與種子區(qū)域生成、區(qū)域合并的彩色圖像分割算法。首先將RGB顏色空間轉換成HSI間，應用分水嶺算法對圖像進行初始化分割，形成過分割效果。接著基于分水嶺算法得到的

發(fā)表于 12-14 14:41 ?1次下載

<b class='flag-5'>一種</b>新的彩色圖像<b class='flag-5'>分割</b>算法

一種牙齒半自動精確分割算法

兩側的特征點構建局部凹陷感知調和場矩陣，計算模型局部區(qū)域的標量場;其次在局部網(wǎng)格上得一系列等值線利用一種投票機制選取最佳等值線作為牙齒分割線;最后利用

發(fā)表于 04-29 15:39 ?3次下載

<b class='flag-5'>一種</b>牙齒半自動精確<b class='flag-5'>分割</b>算法

一種高精度的肝臟圖像自動分割算法

在利用卷積神經(jīng)網(wǎng)絡分割肝臟邊界較模糊的影像數(shù)據(jù)時容易丟失位置信息，導致分割精度較低。針對該問題，提出一種基于分水嶺修正與U-Net模型相結合的肝臟圖像自動

發(fā)表于 05-27 15:17 ?2次下載

SAM-Adapter：首次讓SAM在下游任務適應調優(yōu)！

在這些基礎模型中，Segment Anything Model（SAM）作為一個在大型視覺語料庫上訓練的通用圖像分割模型取得了顯著的突破。事

發(fā)表于 04-20 10:13 ?1600次閱讀

SAM分割模型是什么？

SAM是一類處理圖像分割任務的通用模型。與以往只能處理某種特定類型圖片的圖像分割模型不同，

發(fā)表于 05-20 09:30 ?2244次閱讀

近期分割大模型發(fā)展情況

SAM（Segment Anything Model）Meta 的 FAIR 實驗室發(fā)布的一種最先進的圖像分割模型，該模型將自然語言處理領域

發(fā)表于 05-22 16:26 ?870次閱讀

近期<b class='flag-5'>分割</b>大<b class='flag-5'>模型</b>發(fā)展情況

第一篇綜述！分割一切模型(SAM)的全面調研

SAM 是一個提示型模型，其在 1100 萬張圖像上訓練了超過 10 億個掩碼，實現(xiàn)了強大的零樣本泛化。許多研究人員認為「這是 CV 的 GPT-3 時刻，因為 SAM 已經(jīng)學會了物體

發(fā)表于 05-24 14:36 ?1004次閱讀

第<b class='flag-5'>一</b>篇綜述！<b class='flag-5'>分割</b><b class='flag-5'>一</b>切<b class='flag-5'>模型</b>(<b class='flag-5'>SAM</b>)的全面調研

基于一種移動端高性能 Stable Diffusion 模型

? Stable Diffusion （SD）是當前最熱門的文本到圖像（text to image）生成擴散模型。盡管其強大的圖像生成能力令人震撼，一個明顯的不足是需要的計算資源巨大，推理速度很慢

發(fā)表于 06-12 10:14 ?791次閱讀

基于<b class='flag-5'>一種</b>移動端高性能 <b class='flag-5'>Stable</b> Diffusion <b class='flag-5'>模型</b>

YOLOv8最新版本支持SAM分割一切

分割任何模型（Segment Anything Model - SAM）是一種突破性的圖像分割模型

發(fā)表于 06-18 11:42 ?1608次閱讀

基于SAM設計的自動化遙感圖像實例分割方法

RSPrompter的目標是學習如何為SAM生成prompt輸入，使其能夠自動獲取語義實例級掩碼。相比之下，原始的SAM需要額外手動制作prompt，并且是一種類別無關的分割方法。

發(fā)表于 07-04 10:45 ?934次閱讀

介紹一種自動駕駛汽車中可行駛區(qū)域和車道分割的高效輕量級模型

本文介紹了TwinLiteNet：一種自動駕駛汽車中可行駛區(qū)域和車道分割的高效輕量級模型。語義分割是自動駕駛中理解周圍環(huán)境的一項常見任務。

發(fā)表于 08-03 14:20 ?1268次閱讀

ICCV 2023 | 超越SAM！EntitySeg：更少的數(shù)據(jù)，更高的分割質量

，需要在不同的圖像領域、新的物體類別以及各種圖像分辨率和質量下都能夠保持魯棒性。為了解決這個問題，早在 SAM[6] 模型一年之前，一種不考慮類別的實體

發(fā)表于 10-02 10:40 ?813次閱讀

圖像分割與語義分割中的CNN模型綜述

圖像分割與語義分割是計算機視覺領域的重要任務，旨在將圖像劃分為多個具有特定語義含義的區(qū)域或對象。卷積神經(jīng)網(wǎng)絡（CNN）作為深度學習的一種核心模型，在圖像

發(fā)表于 07-09 11:51 ?828次閱讀

3D視覺工坊
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot ROS2概述和實踐入門
Hot 一文詳解卡爾曼濾波

New 全面總結動態(tài)NeRF
New 機器人沒有度量信息如何導航

精選推薦
更多

文章

資料

帖子

折疊屏2024的新東西、好東西、舊東西

腦極體
1天前

588 閱讀

艾為車規(guī)氛圍燈驅動芯片AW23003QNR-Q1解析已過AEC-Q100認證

艾為之家
1天前

580 閱讀

使用Keithley源表進行DC-DC電源管理芯片效率測試

泰克科技
2天前

831 閱讀

Mate70首銷兩周超越前代！字節(jié)掀AI價格戰(zhàn)！本周熱點科技新聞點評

章鷹觀察
2天前

798 閱讀

基于英特爾開發(fā)板開發(fā)ROS應用

英特爾物聯(lián)網(wǎng)
2天前

444 閱讀

中國電信云計算PaaS技術與應用

159520
2.63 MB

免費

80下載

幾種常見開關電源電路圖

o_dream
0.22 MB

免費

96下載

基于openharmony適配移植的滾動視圖組件

姚小熊27
4.32 MB

免費

1下載

ZBJCalendar iOS日歷框架

小峰
0.00 MB

2積分

1下載

rpcms-PHP內容管理系統(tǒng)

熊本熊
3.42 MB

免費

0下載

【RA-Eco-RA4E2-64PIN-V1.0開發(fā)板試用】+小白折騰瑞薩RA系列全過程02

jf_80431208
1天前

166 閱讀

【敏矽微ME32G070開發(fā)板免費體驗】新建工程（MDK）

吉吉祥
2天前

342 閱讀

【RA-Eco-RA4E2-64PIN-V1.0開發(fā)板試用】按鍵點燈：使用輪詢方式和中斷方式實現(xiàn)

jf_64583430
2天前

299 閱讀

淺談加密芯片的一種破解方法和對應加密方案改進設計

jf_38636298
3天前

1081 閱讀

【RA-Eco-RA4E2-64PIN-V1.0開發(fā)板試用】4、Amazon FreeRTOS初探，第一個程序

lustao
3天前

2143 閱讀

推薦專欄
更多