色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

簡述深度學習的基準目標檢測及其衍生算法

jf_78858299 ? 來源:電子學報 ? 作者:程旭, 宋晨, 史金鋼 ? 2023-02-27 15:31 ? 次閱讀

1 基于深度學習的基準目標檢測模型

基于深度學習的目標檢測方法根據(jù)有無區(qū)域提案階段劃分為區(qū)域提案檢測模型和單階段檢測模型,其最近發(fā)展歷程在圖1中畫出。

圖片

▲ 圖1 基于深度學習的目標檢測模型的發(fā)展歷程

1.1 區(qū)域提案目標檢測基準模型

區(qū)域提案檢測模型將目標檢測任務分為區(qū)域提案生成、特征提取和分類預測三個階段。在區(qū)域提案生成階段,檢測模型利用搜索算法如選擇性搜索(Selective Search,SS)、EdgeBoxes、區(qū)域提案網(wǎng)絡(Region Proposal Network, RPN)等在圖像中搜尋可能包含物體的區(qū)域。在特征提取階段,模型利用深度卷積網(wǎng)絡提取區(qū)域提案中的目標特征。在分類預測階段,模型從預定義的類別標簽對區(qū)域提案進行分類和邊框信息預測。

2012年,卷積神經(jīng)網(wǎng)絡AlexNet通過強大的分層特征學習能力在ImageNet分類任務中奪魁,其分類結果比傳統(tǒng)算法要好得多。之后Girshirk等基于此提出通用的目標檢測模型RCNN。

受空間金字塔匹配啟發(fā),He等提出空間金字塔池化網(wǎng)絡(Spatial Pyramid Pooling Network, SPPNet)解決RCNN模型中固定大小圖像輸入的問題。盡管模型能解決固定大小圖像輸入的問題并大幅減少檢測時間,但網(wǎng)絡輸出特征需要磁盤存儲且網(wǎng)絡不能通過反向傳播更新卷積層參數(shù)。Fast RCNN,F(xiàn)aster RCNN解決了該問題。

盡管Faster RCNN運用RPN能有效地縮短檢測時間,但圖像中上百個區(qū)域提案仍需輸入到區(qū)域子網(wǎng)絡來分類與坐標回歸,這是模型的計算瓶頸。若直接減少區(qū)域子網(wǎng)絡的深度則會引起基于分類初始模型與檢測模型的矛盾,因為分類會增加物體的平移不變性而檢測則減少物體的平移不變性。為解決上述問題,代表性的方法有RFCN,Mask RCNN。上述模型的相關信息在表1中列出。

圖片

▲ 表1 區(qū)域提案目標檢測基準模型

1.2 單階段目標檢測基準模型

雖然區(qū)域提案檢測模型保持著高效的檢測效率,但其耗費時間長難以得到實際應用。相較于區(qū)域提案檢測模型,單階段檢測模型聯(lián)合區(qū)域提案和分類預測,輸入整張圖像到卷積神經(jīng)網(wǎng)絡中提取特征,最后直接輸出目標類別和邊框位置信息。這類代表性的方法有:YOLO,YOLOv2,YOLOv3,YOLOv4,SSD,CornerNet等。

針對YOLO模型中目標定位不準確的問題,Liu等人提出更準確的單階段實時檢測模型SSD(Single Shot MultiBox Detector),其結合YOLO的回歸思想與Faster RCNN的錨框機制。之后DSSD(DeconvolutionalSingle Shot Detector)用于小目標檢測。然而,錨框機制也存在明顯的缺陷,如正負樣本不平衡、引入過多的超參數(shù)而折戟檢測速度與性能等。基于此,研究者提出了無錨框單階段檢測模型,上述模型的相關信息在表2中列出。

圖片

▲ 表2 單階段目標檢測基準模型

2 基于深度學習的目標檢測衍生算法

當前主流的基于深度學習的目標檢測方法可分為檢測部件、數(shù)據(jù)增強、優(yōu)化方法和學習策略四個方面。其中檢測部件包含基準模型和基準網(wǎng)絡;數(shù)據(jù)增強包含幾何變換、光學變換等;優(yōu)化方法包含特征圖、上下文模型、邊框優(yōu)化、區(qū)域提案方法、類別不平衡和訓練策略六個方面,學習策略涵蓋監(jiān)督學習、弱監(jiān)督學習和無監(jiān)督學習。本節(jié)從優(yōu)化方法和學習策略這兩個大的方面歸納總結了深度學習下基準目標檢測模型的衍生方法?;谏疃葘W習的目標檢測部件及其代表性的檢測方法如圖2所示。

圖片

▲ 圖2 基于深度學習的目標檢測部件及其代表性的檢測方法

2.1 融合特征圖的目標檢測模型

特征圖是圖像經(jīng)過卷積池化層輸出的結果,大多數(shù)基準檢測模型只在頂層特征圖做預測,這在很大程度上限制了模型的性能。為了充分提取特征信息,現(xiàn)有檢測模型從三個角度融合淺中深層特征,分別是:結合多層特征圖單層預測模型(ION、HyperNet)、分層預測模型(MSCNN、SSD、RFBNet、TridentNet)和結合多層特征圖多層預測模型(FPN、DSSD、STDN、DetNet、M2Det、FCOS、EfficientDet)。相關模型信息在表4中列出。

圖片

▲ 表4 融合特征圖的目標檢測模型

2.2 結合上下文信息的目標檢測模型

在物體遮擋、背景信息雜亂或圖像質量不佳的情況下,根據(jù)圖像的上下文信息能更有效更精確地檢測?,F(xiàn)有的目標檢測模型主要考慮將上下文信息分為全局上下文信息(DeepIDNet、ION、CPF)和局部上下文信息(MR?CNN、GBDNet、ACCNN、CoupleNet)。相關模型的信息在表5中列出。

圖片

▲ 表5 上下文模型和邊框優(yōu)化模型

2.3 優(yōu)化邊框定位的目標檢測模型

當前檢測模型在小目標檢測表現(xiàn)不佳的主要原因是定位錯誤偏多,包含定位偏差大和重復預測,因此部分研究著眼于優(yōu)化邊框定位來提升檢測性能,代表性的模型有MRCNN、Cascade RCNN、Grid RCNN等。此外,一些算法使用后處理步驟來優(yōu)化預測框位置,如NMS、Soft?NMS、Softer?NMS等。

2.4 高效區(qū)域提案的目標檢測模型

區(qū)域提案是圖像中可能包含物體的區(qū)域,它是兩階段檢測模型中性能保障的關鍵。早期的檢測模型DPM使用滑動窗口方法,存在計算復雜度高和定位性能差的問題。RCNN使用SS算法提取候選區(qū)域并利用卷積神經(jīng)網(wǎng)絡提取圖像特征,其檢測效率和性能上均有大幅提高。EdgeBox利用圖像中低維線索如顏色、紋理、邊緣、梯度等對其分類,表現(xiàn)出良好的檢測性能。Kuo等人在EdgeBox基礎上提出DeepBox檢測模型,運行速度更快且提案窗口召回率更高。Ren等人提出使用RPN生成候選區(qū)域的Faster RCNN檢測模型,在特征圖上以每個像素點為中心生成三個尺度和三個長寬比總共九個錨框。Ghodrati等人提出DeepProposal檢測模型,使用多個級聯(lián)的卷積特征來生成對象提案再構建逆級聯(lián)選擇圖像中可能存在的對象位置。

2.5 處理類別不平衡的目標檢測模型

類別不平衡的主要矛盾是負樣本數(shù)遠多于正樣本數(shù),導致訓練的深度模型效率低。傳統(tǒng)檢測算法常用Bootstrapping方法處理此問題,之后RCNN模型使用困難樣本挖掘(Hard ExampleMining,HEM)方法來處理。Shrivastava等人在HEM基礎上提出在線困難樣本挖掘方法(OnlineHard Example Mining, OHEM),其根據(jù)區(qū)域提案損失有選擇性地反向傳播負樣本區(qū)域更新梯度。最近,Lin等人提出使用Focal Loss的單階段檢測模型RetinaNet,使模型更關注于那些少量的困難樣本。表6總結了類別不平衡處理模型和訓練策略方法。

圖片

▲ 表6 類別不平衡處理模型和訓練策略方法

2.6 訓練策略

大多數(shù)目標檢測模型采取小批量樣本進行訓練,然而小批量樣本訓練存在梯度不穩(wěn)定、訓練時間長等問題。研究者們提出一些高效的方法解決上述問題,典型的方法有:MegNet,LargeDet,SNIP,SNIPER,DSOD, ScratchDet等。相關訓練策略的信息在表6中列出。

2.7 基于弱監(jiān)督學習的目標檢測方法

數(shù)據(jù)標注的昂貴性和人工標注的主觀性已成為一個棘手的問題?;谌醣O(jiān)督學習的目標檢測方法主要劃分為三類:基于分割的目標檢測方法、基于多示例學習的目標檢測方法和基于深度學習的目標檢測方。這些模型的相關信息在表7中列出。

圖片

▲ 表7 基于弱監(jiān)督學習的通用目標檢測方法

2.8 基于無監(jiān)督的目標檢測方法

盡管基于弱監(jiān)督學習的目標檢測方法僅需要圖像級別信息即可訓練,表現(xiàn)出了良好的性能。然而,在現(xiàn)實應用中圖像往往沒有標注信息。目前,基于無監(jiān)督學習的目標檢測方法大致可分為兩類:基于分割的目標檢測方法和基于領域自適應的目標檢測方法。模型的相關信息在表8中列出。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關推薦

    基于深度學習目標檢測算法解析

    本節(jié)主要將近年來基于候選區(qū)域的目標檢測算法分為五個部分進行綜述,首先介紹了Faster R-CNN[14]框架的發(fā)展歷程,然后綜述了對Faster R-CNN算法的四個重要組成部分(特征提取網(wǎng)絡、ROI Pooling層、RPN
    發(fā)表于 01-09 10:52 ?1298次閱讀

    全網(wǎng)唯一一套labview深度學習教程:tensorflow+目標檢測:龍哥教你學視覺—LabVIEW深度學習教程

    到的, 深度學習可以搞定。特別是在圖像分類, 目標檢測這些問題上取得了顯著的提升。下圖是近幾年來深度學習
    發(fā)表于 08-10 10:38

    【HarmonyOS HiSpark AI Camera】基于深度學習目標檢測系統(tǒng)設計

    、并行處理、從目標檢測算法嵌入式平臺的實現(xiàn)的設計要求出發(fā),基于深度學習目標檢測算法特點,采用軟
    發(fā)表于 09-25 10:11

    Labview深度學習tensorflow人工智能目標檢測-教學貼【連載】

    本帖最后由 wcl86 于 2021-6-3 16:23 編輯 應廣大學員要求,現(xiàn)開通Labview深度學習tensorflow人工智能目標檢測-教學貼,有需要的學員,可以收藏本
    發(fā)表于 05-28 11:58

    如何使用深度學習進行視頻行人目標檢測

    近年來,隨著深度學習在計算機視覺領域的廣泛應用,基于深度學習的視頻運動目標檢測受到廣大學者的青睞
    發(fā)表于 11-19 16:01 ?22次下載
    如何使用<b class='flag-5'>深度</b><b class='flag-5'>學習</b>進行視頻行人<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>

    基于深度學習目標檢測算法

    整體框架 目標檢測算法主要包括:【兩階段】目標檢測算法、【多階段】目標檢測算法、【單階段】
    的頭像 發(fā)表于 04-30 10:22 ?1.1w次閱讀
    基于<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的<b class='flag-5'>目標</b><b class='flag-5'>檢測算法</b>

    基于深度學習的行為識別算法及其應用

    基于深度學習的行為識別算法及其應用
    發(fā)表于 06-16 14:56 ?20次下載

    基于深度學習目標檢測研究綜述

    的研究背景、意義及難點,接著對基于深度學習目標檢測算法的兩大類進行綜述,即基于候選區(qū)域和基于回歸算法.對于第一類
    發(fā)表于 01-06 09:14 ?2291次閱讀
    基于<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>研究綜述

    深度學習目標檢測中的應用

    R-CNN 算法在 2014 年提出,可以說是歷史性的算法,將深度學習應用于目標檢測領域,相較于
    的頭像 發(fā)表于 10-31 10:08 ?2030次閱讀

    基于MobileNet的多目標跟蹤深度學習算法

    針對深度學習算法在多目標跟蹤中的實時性問題, 提出一種基于MobileNet的多目標跟蹤算法.
    的頭像 發(fā)表于 11-09 10:23 ?1242次閱讀
    基于MobileNet的多<b class='flag-5'>目標</b>跟蹤<b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>算法</b>

    如何學習基于Tansformer的目標檢測算法

    ,也是近年來理論研究的熱點。作為計算機視覺中的基礎算法,目標檢測對后續(xù)的人臉識別、目標跟蹤、實例分割等任務都起著至關重要的作用。 基于深度
    的頭像 發(fā)表于 06-25 10:37 ?759次閱讀
    如何<b class='flag-5'>學習</b>基于Tansformer的<b class='flag-5'>目標</b><b class='flag-5'>檢測算法</b>

    基于強化學習目標檢測算法案例

    摘要:基于強化學習目標檢測算法檢測過程中通常采用預定義搜索行為,其產(chǎn)生的候選區(qū)域形狀和尺寸變化單一,導致目標
    發(fā)表于 07-19 14:35 ?0次下載

    什么是深度學習算法?深度學習算法的應用

    什么是深度學習算法?深度學習算法的應用 深度
    的頭像 發(fā)表于 08-17 16:03 ?2371次閱讀

    深度學習檢測目標常用方法

    深度學習的效果在某種意義上是靠大量數(shù)據(jù)喂出來的,小目標檢測的性能同樣也可以通過增加訓練集中小目標樣本的種類和數(shù)量來提升。
    發(fā)表于 03-18 09:57 ?872次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>檢測</b>小<b class='flag-5'>目標</b>常用方法

    基于深度學習的小目標檢測

    在計算機視覺領域,目標檢測一直是研究的熱點和難點之一。特別是在小目標檢測方面,由于小目標在圖像中所占比例小、特征不明顯,使得
    的頭像 發(fā)表于 07-04 17:25 ?1287次閱讀
    主站蜘蛛池模板: 国产精品内射久久久久欢欢 | 午夜欧洲亚洲AV永久无码精品 | 亚洲精品成人 | 亚洲AV永久无码精品澳门 | CHINA篮球体育飞机2023 | 国色天香社区视频免费高清3 | 女人精69xxxxx | 成人高清网站 | 久久综合亚洲色hezyo | 国产成人无码精品久久久按摩 | 一二三四在线高清中文版免费观看电影 | 三级中国免费的 | 欧洲美女高清一级毛片 | 日本一本二本三区免费免费高清 | 全免费A敌肛交毛片免费懂色AV | 97国产精品久久精品国产 | 黃色带三级a级 | 久热这里在线精品 | 亚洲成年人在线观看 | 免费韩伦影院在线观看 | 性白俄罗斯高清xxxxx | 美女逼逼毛茸茸 | 亚洲欧美高清在线精品一区 | 1973性农场未删减版 | 久操久操久操 | 99蜜桃在线观看免费视频网站 | 97视频视频人人碰视频 | 在线 | 果冻国产传媒61国产免费 | 快播电影网站大全 | 国产中文在线观看 | 在线观看国产日韩 | 99re28久久热在线观看 | 香蕉精品国产高清自在自线 | 香蕉水蜜桃牛奶涩涩 | 99国产精品人妻无码免费 | 边摸边吃奶边做下面视频 | 国产色欲一区二区精品久久呦 | 中文免费视频 | 国产黄大片在线视频 | 日本wwwhdsex69| 日本无码免费久久久精品 |