色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

目標檢測中的框位置優化

新機器視覺 ? 來源:新機器視覺 ? 2023-05-15 16:13 ? 次閱讀

目標檢測已經有了長足的發展,總體來說根據階段個數,可以劃分為Two-stage(Faster RCNN)、one-stage(SSD) 或者E2E(DETR)。根據是否基于anchor先驗,可以劃分為anchor-based(Faster RCNN)、anchor-free(CornerNet)的方法。 本文主要從目標框位置優化的角度來介紹目標檢測領域的相關工作。框位置優化主要可以分為以下幾個方面

By XYWH,這是指通過優化與ground truth的中心點坐標值、寬和高的值來實現目標框位置的優化

By keypoint,這是指通過優化關鍵點的方式來找到目標框的位置

By LRBT,這是指通過優化與ground truth 四條邊之間的距離的方式來實現目標框位置的優化

By IoU,這是指通過最大化與GT計算得到的IoU來優化目標框的位置

uncertainty,解決目標檢測框真值的邊界不確定性

01

Optimize by XYWH

定義

優化目標為預測bbox的中心點坐標(x,y)和寬高(width, height)與對應真值的差距盡可能的小。 接下來我們以Faster RCNN為例介紹該方法。

思路

基于Anchor的先驗,我們可以得知每個proposal的大概位置。考慮到利用Anchor的先驗信息,作者使得預測框到anchor的距離和與子匹配的GT框到anchor的距離盡可能的相似。距離:XYWH的差值。

匹配方法

1、代表和的IoU值;大于指定閾值,代表i和j之間具有匹配關系 2、對應最大IoU的;如第一步j沒有得到任何匹配,則在此步,i和j具備匹配關系

優化公式

14cde8b2-f19c-11ed-90ce-dac502259ad0.png

14db1a8c-f19c-11ed-90ce-dac502259ad0.png

上述是Faster RCNN的優化目標函數,我們的目標就是讓盡可能的逼近,之間的優化函數可以選擇L2,or L1 作者這里使用了Smooth L1

Q&A

為什么是SmoothL1?A: smooth L1 在 x 較小時,對 x 的梯度也會變小,而在 x 很大時,對 x 的梯度的絕對值達到上限 1,也不會太大以至于破壞網絡參數。smooth L1 可以避開 L1 和 L2 損失的缺陷。

14e3b69c-f19c-11ed-90ce-dac502259ad0.png

為什么要除?A: 消除不同anchor大小帶來的影響,相當于歸一化為什么w和h的優化要以log的形式進行?A: target(H和W)是學習一個放縮的尺度,因此尺度值需要大于0,因此需要使用exp,對應的這里為log函數

14efa664-f19c-11ed-90ce-dac502259ad0.png

02

Optimize by Keypoint

定義

優化目標為找到物體的兩個關鍵點:左上點和右下點。核心為一個semantic segmentation問題。 接下來我們以Corner Net為例介紹該方法。

思路

不同于基于Anchor的方法,本方法需要先識別關鍵點在圖中的位置。由于在pooling過程中會引入左邊的誤差,所以需要再針對每個關鍵點預測一個offset。

Q&A

如何訓練和預測關鍵點?一個點一個pixelA:作者使用2D Gaussian來生成,如下圖所示,針對每個pixel,生成一個半徑大小為r的圓形Gaussian分布。半徑r的大小是自適應的。

14fb22aa-f19c-11ed-90ce-dac502259ad0.png

半徑r是通過下圖所示的三種方式計算得到的最小值

15070958-f19c-11ed-90ce-dac502259ad0.png

若一個pixel對應了多個Gaussian分布的值,選擇最大的。如何根據top-left和bottom-right關鍵點兩兩組合形成最終的bbox?A:作者提出針對每個keypoint 預測一個embedded vector,當top_left和bottom_left的embedded vector相似度大于一定閾值的時候則認為他們是描述的同一個bbox。則形成一個bboxkeypoint往往落在物體的外部,對應位置的特征可能不能很好表征物體,會增加識別關鍵點的難度。A:作者提出了CornerPooling,其結構如下圖所示

150ddeae-f19c-11ed-90ce-dac502259ad0.png

優化公式

綜上所述,在該方式中,我們需要以下三個優化目標 1、關鍵點的分類,可以看成一個語義分割任務,作者采用了focal loss的變種,如下圖所示

1514ae64-f19c-11ed-90ce-dac502259ad0.png

2、每個關鍵點的offset預測,每個關鍵點offset的真值如下式所示。作者采用smooth l1去優化

1520bd08-f19c-11ed-90ce-dac502259ad0.png

3、每個關鍵點的embedded vector預測,作者使用下式來優化embedded vector。讓屬于同一個物體的vector相似,不屬于同一個物體的不相似

152d80e2-f19c-11ed-90ce-dac502259ad0.png

153a8ada-f19c-11ed-90ce-dac502259ad0.png

整體訓練&推理流程

整個cornernet 的訓練和推理流程如下圖所示

15432a3c-f19c-11ed-90ce-dac502259ad0.png

03

Optimize by LRBT上述基于關鍵點回歸的方法有幾個缺點 1、容易產生ghost bbox,這是由于tl br的embedded 相似度的確較高產生的 2、后處理的時候,若關鍵點較多,復雜度較高。為K^2的復雜度。 為了解決該問題,作者提出了基于LRBT的優化方式

定義

優化目標為物體的“中心點”距離四條邊的距離

1557b808-f19c-11ed-90ce-dac502259ad0.png

接下來我們以FCOS為例介紹該方法。

思路

在feature map上找到每個“中心點”,針對每個中心點預測和他對應的框的四個值。

Q&A

1、如何定義“中心點” A:我們需要找到特征圖上每個location(pixel)和gt_bbox的匹配關系,然后將匹配到的gt_bbox作為真值。 匹配關系: - location落在某個gt_bbox內部,這里的落在內部可以直接的理解為落在內部,也可以替換成其他規則。例如真實中心的某個范圍。 - 為了加速收斂,l、r、t、b應該在某一個范圍內,如果不在這個范圍內,就以為著應該由其他location來優化。例如,都應該在scale_factor的范圍內 2、如何解決一個物體框可能包括了多個“中心點” 可以支持這種1對多的關系,一個物體框有多個中心點負責預測,后續通過NMS消除。 但是每個中心點的權重作者認為是不一樣的,因為距離物體實際中心近的中心點其難度較低,應該就越準確,所有在NMS的時候權重應該高。所以作者多了一個branch來預測centerness,即用于評估每個中心點的難易程度。

1562d9ea-f19c-11ed-90ce-dac502259ad0.png

3、如何解決一個中心點可能落在多個物體框內部 作者選擇面積最小的bbox作為優化目標,其實也可以優化多個?

04

Optimize by IoU上述基本都是基于距離的回歸,但是我們最終的評價指標是IoU,所以我們優化的目標和我們最終評價的指標之間還存在一些差異。在下面的case中,第一行所有情況的L2loss都是一樣的,但是IoU和GIoU是存在一定差異的。在第二行中,L1 Loss都是一樣的,但是IoU 和 GIoU 也是不一樣的。

1568814c-f19c-11ed-90ce-dac502259ad0.png

為了解決上述的差異,作者提出了使用IoU作為我們的優化目標

定義

優化目標為使得預測框和真值框IoU最大,使用IoU 作為損失函數主要有以下兩個優勢 1. 優化目標和評價指標存在差異,Ln(L2, L1)范式優化和IoU優化并不完全等價,如上圖所示。 2. IoU對目標物體的scale不敏感。 但是直接使用IoU Loss也存在如下兩個問題 1. IoU值容易為0,且始終無法優化。 2. IoU無法辨識不同方式的對齊,比如方向不一致。 為了解決上述問題,作者提出了GIoU General IoU Loss

GIoU

定義公式如下所示,C是包含A和B的最小box。當IoU(A, B)為0的時候,優化目標轉化為讓C與AUB之間的空隙盡可能小。即就是A和B盡可能靠近。

157241b4-f19c-11ed-90ce-dac502259ad0.png

A = np.random.random([N, 4]) B = np.random.random([N, 4]) C = np.zero_like(A) C[:, :2] = np.min(A[:, :2], B[:, :2]) C[:, 2:] = np.max(A[:, 2:], B[:, 2:])實驗結果如下所示

1579a396-f19c-11ed-90ce-dac502259ad0.png

DIoU

Motivation

Distance IoU Loss主要是為了解決如下兩個問題

GIoU訓練過程較慢,作者做的模擬實驗見下圖

157fc294-f19c-11ed-90ce-dac502259ad0.png

GIoU傾向得到一個較大的bbox

GIoU 區分兩個對象之間的對齊方式比較間接,僅通過引入C的方式來反應重疊的方式,不夠直接。如下圖所示。第二幅圖展示來當GIoU一樣的情況下,DIoU是不一致的(前提是,中心點重合的情況下認為擬合的最好)。

15872048-f19c-11ed-90ce-dac502259ad0.png

Contributions

提出了基于IoU Loss的一般性范式,這是我認為最大的貢獻

提出了DIoU Loss,在IoU loss的基礎上將central之間的距離作為懲罰項

在各個數據集和detector上都取得了不錯的效果

Detail

范式:作為認為IoU loss應該優化的目標包括三個方面

兩個框之間的重合度

中心點之間的距離

長寬比的相似性

作者基于上述的1&&2,提出了DIoU Loss,結合1&&2&&3提出了CIoU Loss(C is complete)

DIoU:定義如下所示,其中關鍵中心點之間距離的懲罰項的分子代表兩個框中心點之間的歐式距離。分母是GIoU中矩陣C的對角線變長。分母起到了歸一化的作用。

15916d1e-f19c-11ed-90ce-dac502259ad0.png

CIoU的定義如下所示,它在DIoU的基礎上增加了對長寬比的懲罰項

159a4db2-f19c-11ed-90ce-dac502259ad0.png

05

Optimize by uncertainty

Motivation

不一致性

訓練和測試兩個階段的,如上圖所示,訓練的時候單獨優化classification score和IoU score,測試的時候將其相乘,然后會導致訓練和測試的時候不一致。

測試的時候,進入NMS的是classification score乘IoU score,就會存在一種情況classification score較低,但是IoU score較高,然后使得負樣本沒有被過濾。這是因為IoU score并沒有對負樣本做優化,所有負樣本的IoU score并不受控制,如下圖所示。

Localization Quality Estimation (LQE) 是許多one-stage或者anchor-free方法改善效果的途徑。LQE的常用方法見下圖所示。

15a29972-f19c-11ed-90ce-dac502259ad0.png

但是上述的方法會帶來一定的不一致性1,它主要包括以下兩點

Contribution1為了解決上述的問題,作者提出使用Joint的方式來聯合優化classification score和IoU score。即就是用同一個prediction值即代表classification score又代表IoU score

不靈活性

目前目標檢測的標準框有時候會存在標注的不確定性(或噪聲),如下圖所示。而目前常用的bbox優化方式是優化Dirac分布(具體什么是Dirac分布后續會介紹)。

15a97242-f19c-11ed-90ce-dac502259ad0.png

但是Dirac分布過于固定,不能解決uncertain的問題,因此有人提出了Gaussian 分布。

但是作者認為Gaussian分布過于理想,不能適應于復雜的現實情況。

Contribution2因此,作者提出了不依賴于任何先驗的潛在分布優化(underlying distribution)

Method

Quality Focal Loss

在上一節,我們介紹了作者使用同一個prediction score來同時表示classification score和IoU score,那么優化該值的時候真值應該是什么呢?作者選擇IoU值作為優化的真值,由于IoU是一個[0,1]之間的連續值。而傳統的focal loss優化的目標是{0, 1}這樣的離散值。因此該loss更加泛化一點(general)

Quality Focal Loss就是上述的更加泛化的FocalLoss,其定義如下所示

15b1a322-f19c-11ed-90ce-dac502259ad0.png

上述公式的后部分是展開形式的交叉熵,系數是adaptive的,當預測是和真值接近的時候,系數小,當遠的時候系數大。

Distribution Focal Loss

在本節我們主要介紹以下何為Distribution,以及我們的Distribution Focal Loss。

先看為什么是Distribution?傳統的BBox regression即就是直接優化兩個值,讓pred_w接近真值的w。

換個角度看,假設我們預測的值為pred_w, 我們直接優化pred_w接近w,那么我們就相當于讓pred_w出現的概率是1.0。這即就是Dirac Distribution,其如下圖所示。

15bbd676-f19c-11ed-90ce-dac502259ad0.png

也就是說我們最終的預測值是對所有y可能出現的值計算積分。也就如下公式所示。

15c9cad8-f19c-11ed-90ce-dac502259ad0.png

接下來在看我們的Distribution Focal Loss, 有上式可知,上式是比Dirac更加泛化的形式。因此本文用上式來計算預測的y^。預測y^之前我們需要先清楚兩點

連續值的積分是不好實現的,我們可以用離散值的求和來代替

我們需要確定預測值的范圍。

有了上述兩個條件,我們可以得到pred^的計算公式如下所示。

15d02bbc-f19c-11ed-90ce-dac502259ad0.png

得到上述的y的預測值后,我們如何去優化呢?因為我們知道y^是接近y的,因此我們需要讓int(y)和int(y)+1的prob最大。因此就可以對應下面的公式。

15d7d196-f19c-11ed-90ce-dac502259ad0.png

Discussion

GIoU 是否必須?
根據總的Loss定義,我們發現GIoU貌似不是必須,因為通過
distribution focal loss也可以起到bbox優化的目的。因此我們做了對比實驗,發現取消GIoU loss會帶來小幅度的指標下降。

別的應用場景
數據分類(帶有噪聲)。針對每個類,我們將其拆分成N份(0., 0.1, 0.2, …, 1.0),分別預測每一份的概率,然后求和,即為最終該類別的概率。

distribution的意義
分布越陡峭,證明越確定,否則越不確定。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 函數
    +關注

    關注

    3

    文章

    4333

    瀏覽量

    62708
  • 目標檢測
    +關注

    關注

    0

    文章

    209

    瀏覽量

    15622

原文標題:總結 | 目標檢測中的框位置優化

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    對象檢測邊界損失函數–從IOU到ProbIOU介紹

    目標檢測損失函數的選擇在目標檢測問題建模至關重要。通常,目標
    的頭像 發表于 01-24 10:50 ?2916次閱讀
    對象<b class='flag-5'>檢測</b>邊界<b class='flag-5'>框</b>損失函數–從IOU到ProbIOU介紹

    結合預測目標之間的歸一化距離來提出距離-IoU (DIoU) Loss

    1、IoU深入解析  邊界回歸是目標檢測的關鍵步驟,在現有方法,雖然-norm loss 被廣泛用于邊界回歸,但它不是針對評估指標量身
    發表于 11-14 15:46

    基于YOLOX目標檢測算法的改進

    并應用于邊界回歸損失,提高了 YOLOX 在 KITTI 數據集上的檢測精度,檢測出更多的遮擋目標;采用動態錨
    發表于 03-06 13:55

    計算機視覺之目標檢測

    目標檢測是計算機視覺領域中一個新興的應用方向。圖像分類是對圖像進行分類,比如判斷圖像是否是車。定位分類不僅要圖片分類,而且需要確定目標在圖像
    發表于 03-06 06:02 ?2次下載
    計算機視覺之<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>

    基于神經網絡的遙感圖像飛機目標檢測模型

    針對遙感圖像飛機檢測存在的背景復雜和目標尺度變化大等問題,提出基于深度神經網絡的遙感圖像飛機目標檢測模型DC-DNN。利用圖像底層特征制作
    發表于 03-30 09:24 ?17次下載
    基于神經網絡的遙感圖像飛機<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>模型

    解析在目標檢測怎么解決小目標的問題?

    導讀 本文介紹了一些小目標物體檢測的方法和思路。 在深度學習目標檢測,特別是人臉檢測
    的頭像 發表于 04-26 14:13 ?6277次閱讀
    解析在<b class='flag-5'>目標</b><b class='flag-5'>檢測</b><b class='flag-5'>中</b>怎么解決小<b class='flag-5'>目標</b>的問題?

    一種基于特定目標提議的自適應跟蹤算法

    目前多數跟蹤算法采用尺度遍歷窮搜索策略應對目標的尺度變化,其跟蹤性能和效率不佳。針對此問題基于特定目標提議提岀一種自適應跟蹤算法。對目標提議
    發表于 05-24 15:02 ?8次下載

    解讀目標檢測位置優化

    為anchor-based(Faster RCNN)、anchor-free(CornerNet)的方法。 本文主要從目標位置優化的角度來介紹目標
    的頭像 發表于 06-21 17:40 ?2564次閱讀
    解讀<b class='flag-5'>目標</b><b class='flag-5'>檢測</b><b class='flag-5'>中</b>的<b class='flag-5'>框</b><b class='flag-5'>位置</b><b class='flag-5'>優化</b>

    PyTorch教程-14.7。單發多檢測

    SageMaker Studio Lab 打開筆記本 在第 14.3 節到第 14.6 節,我們介紹了邊界、錨、多尺度目標
    的頭像 發表于 06-05 15:44 ?648次閱讀
    PyTorch教程-14.7。單發多<b class='flag-5'>框</b><b class='flag-5'>檢測</b>

    快速入門自動駕駛目標檢測算法

    的,具有普適性。 3. 當交通場景目標密集、相互遮擋時,改進非極大值抑制算法、合理設計邊界可以有效緩解目標漏檢、誤檢等問題。 4. 當交通場景相對復雜、背景多變時,損失函數的改
    發表于 06-06 09:40 ?0次下載
    快速入門自動駕駛<b class='flag-5'>中</b><b class='flag-5'>目標</b><b class='flag-5'>檢測</b>算法

    一文讀懂手機平面度檢測

    ,手機邊框取消,手機面積也隨之減小,在裝配過程,細小零部件的位置可能更容易錯亂,屏幕也會受貼合影響跟著變形或歪斜錯位,因此
    的頭像 發表于 06-09 10:21 ?1068次閱讀
    一文讀懂手機<b class='flag-5'>中</b><b class='flag-5'>框</b>平面度<b class='flag-5'>檢測</b>

    如何區分圖像分類和目標檢測技術

    目標檢測的問題定義是確定目標在給定圖像位置,如目標定位,以及每個
    發表于 07-11 12:50 ?524次閱讀

    無Anchor的目標檢測算法邊框回歸策略

    R-CNN的邊框回歸策略。? 寫在前面 目標檢測包括目標分類和目標定位2個任務,目標定位一般是用一個矩形的邊界
    的頭像 發表于 07-17 11:17 ?1087次閱讀
    無Anchor的<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>算法邊框回歸策略

    目標檢測與識別技術有哪些

    視頻識別并定位感興趣的目標,通常包括目標的類別和位置信息。目標識別(Object Recognition)是指對
    的頭像 發表于 07-17 09:40 ?629次閱讀

    目標檢測與圖像識別的區別在哪

    檢測(Object Detection)是指在圖像或視頻識別并定位感興趣的目標,通常包括目標的類別和位置
    的頭像 發表于 07-17 09:51 ?928次閱讀
    主站蜘蛛池模板: 国产免费看片| 亲胸揉胸膜下刺激视频网站APP| 日本人奶水中文影片| 俄罗斯另类Z0Z0ZOZO| 无码一区国产欧美在线资源| 国产欧美日韩精品a在线观看高清| 亚洲国产精品免费观看| 久久精品亚洲AV高清网站性色| 97精品国产高清在线看入口| 欧美gv明星| 国产高清国内精品福利色噜噜| 亚洲精品国产精品麻豆99| 久久婷婷色香五月综合激情| MD传媒MD0021在线观看| 天堂so导航| 老熟人老女人国产老太| 成人在线视频播放| 一边亲着一面膜下的免费过程| 名女躁b久久天天躁| 国产精品系列在线一区| 中字幕视频在线永久在线 | 最新色导航| 四虎影视国产精品亚洲精品hd | 国产传媒18精品免费观看| 一级毛片免费视频网站| 色噜噜2017最新综合| 久久免费精品一区二区| 国产成人精品电影在线观看| 中文字幕成人在线观看| 午夜福利免费院| 欧美伦理片第7页| 国语92电影网午夜福利| 成人国产在线视频| 在线不卡日本v二区到六区| 四虎4hu亚洲精品| 欧美成人国产| 久久精品免费观看久久| 国产情侣真实露脸在线| 白嫩美女直冒白浆| 0951影音在线| 一个人色导航|