本文是對(duì) CVPR2019 論文《Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression》的解讀,通過(guò)對(duì) Loss 的修改提升檢測(cè)任務(wù)的效果,覺(jué)得思路很棒。
該文作者來(lái)自斯坦福大學(xué)與澳大利亞阿德萊德大學(xué)。
IoU是檢測(cè)任務(wù)中最常用的指標(biāo),由于IoU是比值的概念,對(duì)目標(biāo)物體的scale是不敏感的。然而檢測(cè)任務(wù)中的BBox的回歸損失(MSE loss, l1-smooth loss等)優(yōu)化和IoU優(yōu)化不是完全等價(jià)的(見下圖)。
而且 Ln范數(shù)對(duì)物體的scale也比較敏感。這篇論文提出可以直接把IoU設(shè)為回歸的loss。然而有個(gè)問(wèn)題是IoU無(wú)法直接優(yōu)化沒(méi)有重疊的部分。為了解決這個(gè)問(wèn)題這篇paper提出了GIoU的思想~
IoU與L2范數(shù)的優(yōu)化不是等效的。要將IoU設(shè)計(jì)為損失,主要需要解決兩個(gè)問(wèn)題:
預(yù)測(cè)值和Ground truth沒(méi)有重疊的話,IoU始終為0且無(wú)法優(yōu)化
IoU無(wú)法辨別不同方式的對(duì)齊,比如方向不一致等。
IoU 無(wú)法代表 overlap 的方式
GIoU
所以論文中提出的新 GIoU 是怎么設(shè)計(jì)的呢:
假如現(xiàn)在有兩個(gè)任意性質(zhì) A,B,我們找到一個(gè)最小的封閉形狀C,讓C可以把A,B包含在內(nèi),然后我們計(jì)算C中沒(méi)有覆蓋A和B的面積占C總面積的比值,然后用A與B的IoU減去這個(gè)比值:
GIoU有如下性質(zhì):
與IoU類似,GIoU也可以作為一個(gè)距離,loss可以用 (下面的公式)來(lái)計(jì)算
同原始 IoU 類似,GIoU 對(duì)物體的大小不敏感。GIoU 總是小于等于 IoU,對(duì)于 IoU,有
GIoU 則是
在兩個(gè)形狀完全重合時(shí),有
由于 GIoU 引入了包含 A,B 兩個(gè)形狀的 C,所以當(dāng) A,B 不重合時(shí),依然可以進(jìn)行優(yōu)化。
總之就是保留了IoU的原始性質(zhì)同時(shí)弱化了它的缺點(diǎn)。于是論文認(rèn)為可以將其作為IoU的替代。
GIoU 作為 BBox 回歸的損失
具體一點(diǎn),如何計(jì)算損失呢?我們以 2D detecation 為例:
假設(shè)我們現(xiàn)在有預(yù)測(cè)的 Bbox 和 groud truth 的 Bbox 的坐標(biāo),分別記為:
注意我們規(guī)定對(duì)于預(yù)測(cè)的 BBox 來(lái)說(shuō),有
主要是為了方便之后點(diǎn)的對(duì)應(yīng)關(guān)系。
作者做了一系列的實(shí)驗(yàn)(針對(duì)分割任務(wù)和分類任務(wù)有一定 loss 的調(diào)整設(shè)計(jì),不過(guò)論文中沒(méi)有詳細(xì)給出)結(jié)果是 IoU loss 可以輕微提升使用 MSE 作為 loss 的表現(xiàn),而 GIoU 的提升幅度更大,這個(gè)結(jié)論在 YOLO 算法和 faster R-CNN 系列上都是成立的:
PASCAL VOC 2007上的提升with Yolo
MS COCO的提升with Yolo
PASCAL VOC 2007 with faster-RCNN
更多內(nèi)容大家可以參考項(xiàng)目主頁(yè):
https://giou.stanford.edu/
代碼實(shí)現(xiàn):
https://github.com/generalized-iou
原文鏈接:
https://zhuanlan.zhihu.com/p/57992040
-
計(jì)算
+關(guān)注
關(guān)注
2文章
449瀏覽量
38788 -
回歸
+關(guān)注
關(guān)注
0文章
4瀏覽量
7052
原文標(biāo)題:CVPR2019 | 斯坦福學(xué)者提出GIoU,目標(biāo)檢測(cè)任務(wù)的新Loss
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論