首發:AI公園公眾號
作者:Tony Shin
編譯:ronghuaiyang
導讀
對CBNet進行了一個直觀的介紹。
https://towardsdatascience.co...
論文:https://arxiv.org/pdf/1909.03...
代碼:https://github.com/PKUbahuang...
CBNet在COCO測試數據集上的平均精度為53.3。
作者聲稱,使用一個更強大的主干可以提高目標檢測器的性能。為了做到這一點,他們提出了一種新的策略,即通過相鄰主干之間的組合連接來組裝多個相同的主干。通過這樣做,他們提出了一個更強大的主干,稱為組合主干網絡。
如上圖所示,CBNet由多個相同的骨干網和相鄰骨干網之間的組合連接組成。從左到右,每個階段的輸出都在一個輔助主干中,這也可以看作是更高層次的特征。每個特征層的輸出通過組合連接流到后續主干網的并行階段,作為輸入的一部分。這樣,多個高級和低級特征被融合,以產生更豐富的特征表示。
本文介紹了雙主干網(DB)和三主干網(TB)兩種體系結構。從命名中可以猜到,DB由兩個相同的骨干組成,而TB由三個相同的骨干組成。性能差異將在后面的文章中討論。
為了從主干中生成多個輸出,本文引入了一個組合連接塊。這個塊由一個1x1卷積和一個批處理歸一化層組成。添加這些層是為了減少通道的數量并執行一個upsample操作。
最后的主干(位于圖中最右邊),被命名為主主干,用于目標檢測。前面的骨干的輸出特征被送入RPN/檢測頭,而每個輔助骨干的輸出被送入相鄰的骨干。
組合的形式
還有四種組合樣式。
- 相鄰的更高層次的組合是前面部分中解釋的風格。使用組合連接塊將來自輔助骨干網的每個輸出特征饋入相鄰骨干網。
- 相同層次的組合是另一種簡單的組合樣式,它將前一骨干的相鄰較低級階段的輸出提供給后續骨干。如圖所示,此樣式沒有使用組合連接塊。來自較低層次主干網的特征直接添加到鄰近的主干網中。
- 相鄰的低層的組合與AHLC非常相似。唯一的區別是來自前主干較低級階段的特征被傳遞到后來的主干。
- 密集的高層的組合的靈感來自于DenseNet的paper,其中每一層都與隨后的所有層連接,在一個stage上建立密集的連接。
上面的表格展示了不同組合風格之間的對比。我們可以觀察到AHLC樣式優于其他復合樣式。這背后的原因在論文中得到了很好的解釋。作者認為,將前一個主干的低層特征直接添加到后續主干的高層特征中會損害后一個特征的語義信息。另一方面,在后續主干的淺層特征基礎上增加前一主干的深層特征,可以增強后一主干特征的語義信息。
結果
上表顯示了MS-COCO測試數據集的檢測結果。第5-7列為目標檢測結果,第8-10列為實例分割結果。這清楚地表明,利用更多的骨干的體系結構提高了網絡的性能。
總結
本文介紹了一種叫做CBNet的新架構。通過組成多骨干體系結構,該網絡將檢測網絡的準確率提高約1.5%至3%。增加的參數大小和訓練時間值得進一步研究。
—END—
英文原文:https://towardsdatascience.co...
推薦閱讀
關注圖像處理,自然語言處理,機器學習等人工智能領域,請點擊關注AI公園專欄。
歡迎關注微信公眾號
審核編輯:符乾江
-
檢測
+關注
關注
5文章
4498瀏覽量
91561 -
深度學習
+關注
關注
73文章
5507瀏覽量
121299
發布評論請先 登錄
相關推薦
評論