色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

LaSOT數據集的構造原理和評估方法

WpOh_rgznai100 ? 來源:lq ? 2019-07-18 14:52 ? 次閱讀

CVPR 2019期間,專注于AR技術,整合軟硬件人工智能公司亮風臺公開大規模單目標跟蹤高質量數據集LaSOT,包含超過352萬幀手工標注的圖片和1400個視頻,這也是目前為止最大的擁有密集標注的單目標跟蹤數據集。

論文《LaSOT: A High-quality Benchmark for Large-scale Single Object Tracking》詳細闡述了LaSOT數據集的構造原理和評估方法,由亮風臺、華南理工大學、美圖-亮風臺聯合實驗室等單位共同完成,收錄于CVPR 2019。此外,亮風臺另一算法成果投影AR新成果入選CVPR 2019 oral。

LaSOT貢獻

視覺跟蹤是計算機視覺中最重要的問題之一,其應用領域包括視頻監控、機器人技術、人機交互等。隨著跟蹤領域的巨大進步,人們提出了許多算法。在這一過程中,跟蹤基準對客觀評估起到了至關重要的作用。LaSOT的推出,是希望為行業提供一個大規模的、專門的、高質量的基準,用于深度跟蹤訓練和跟蹤算法的真實評估。

圖1:常用跟蹤數據集統計示意圖。包括OTB-2013、OTB-2015、TC-128、NUS-PRO、UAV123、UAV20L、VOT-2014、VOT-2017和LaSOT。圓直徑與數據集的總幀數數成比例。所提出的LaSOT比所有其他基準都要大,并且專注于長期跟蹤。

觀察和比較不同的跟蹤算法發現,其進一步發展和評估受到現有評測集的限制,存在的問題主要包括:

1.規模小。現有數據集很少有超過400個序列,由于缺乏大規模的跟蹤數據集,很難使用跟蹤特定視頻訓練深度跟蹤器。

2.短時跟蹤。理想的跟蹤器能夠在相對較長的時間內定位目標,目標可能消失并重新進入視圖。然而,大多數現有的基準都集中在短期跟蹤上,其中平均序列長度小于600幀(即20秒左右),而且目標幾乎總是出現在視頻幀中。

3.類別偏見。一個穩健的跟蹤系統應該表現出對目標所屬類別的不敏感性,這意味著在訓練和評估跟蹤算法時都應該抑制類別偏差(或類別不平衡)。然而,現有的基準通常只包含幾個類別,視頻數量不平衡。

許多數據集被提議處理上述問題,然而,并都沒有解決所有的問題。

基于上述動機,他們為社區提供了一個新的大型單目標跟蹤(LaSOT)基準,并提供了多方面的貢獻:

1. LaSOT包含1400個視頻,每個序列平均2512幀。每一幀都經過仔細檢查和手動標記,并在需要時對結果進行目視檢查和糾正。這樣,可以生成大約352萬個高質量的邊界框注釋。

此外,LaSOT包含70個類別,每個類別包含20個序列。據了解,LaSOT是迄今為止最大的具有高質量手動密集注釋的對象跟蹤數據集。

2. 與之前的數據集不同,LaSOT提供了可視化邊界框注釋和豐富的自然語言規范,這些規范最近被證明對各種視覺任務都是有益的,包括視覺跟蹤。這樣做的目標是鼓勵和促進探索集成視覺和語言功能,以實現強大的跟蹤性能。

3. 為了評估現有的跟蹤器,并為將來在LaSOT上的比較提供廣泛的基準,團隊在不同的協議下評估了35個具有代表性的跟蹤器,并使用不同的指標分析其性能。

LaSOT大規模多樣化的數據采集

LaSOT數據集的構建遵循大規模、高質量的密集注釋、長期跟蹤、類別平衡和綜合標記五個原則。

LaSOT基準數據采集涵蓋了各種不同背景下的各種對象類別,包含70個對象類別。大多數類別是從ImageNet的1000個類別中選擇的,但少數例外(如無人機)是為流行的跟蹤應用程序精心選擇的。以往的數據集通常含有的類別少于30個,并且一般分布不均勻。相比之下,LaSOT為每個類別提供相同數量的序列,以減輕潛在的類別偏差。

在確定了LaSOT中的70個對象類別之后,他們從YouTube中搜索了每個類的視頻。最初,他們收集了5000多個視頻??紤]到追蹤視頻的質量和LaSOT的設計原則,他們挑選了1400個視頻。但是,由于大量無關內容,這1400個序列不能立即用于跟蹤任務。例如,對于個人類別的視頻(例如,運動員),它通常在開始時包含每個運動員的一些介紹內容,這不適合跟蹤。因此,他們仔細過濾掉每個視頻中不相關的內容,并保留一個可用于跟蹤的剪輯。此外,LaSOT的每一個分類都包含20個目標,反映了自然場景中的分類平衡和多樣性。

最終,他們通過收集1400個序列和352萬幀的YouTube視頻,在Creative Commons許可下,編譯了一個大規模的數據集。LaSOT的平均視頻長度為2512幀(即30幀每秒84秒)。最短的視頻包含1000幀(即33秒),最長的視頻包含11397幀(即378秒)。

LaSOT提供可視化邊界框注釋

為了提供一致的邊界框注釋,團隊還定義了一個確定性注釋策略。對于具有特定跟蹤目標的視頻,對于每個幀,如果目標對象出現在幀中,則標注者會手動繪制/編輯其邊界框,使其成為最緊的右邊界框,以適合目標的任何可見部分;否則,標注者會向幀提供一個“目標不存在”的標簽,無論是不可見還是完全遮擋。請注意,如任何其他數據集中所觀察到的那樣,這種策略不能保證最小化框中的背景區域。然而,該策略確實提供了一個一致的標注,這對于學習物體的運動是相對穩定的。

雖然上述策略在大多數情況下都很有效,但也存在例外情況。有些物體,例如老鼠,可能有細長和高度變形的部分,例如尾巴,這不僅會在物體的外觀和形狀上產生嚴重的噪聲,而且對目標物體的定位提供很少的信息。他們在LaSOT中仔細識別這些對象和相關的視頻,并為它們的注釋設計特定的規則(例如,在繪制它們時不包括鼠標的尾部)。

圖2:LaSOT示例序列和標注

序列的自然語言規范由描述目標的顏色、行為和環境的句子表示。對于LaSOT,他們為所有視頻提供1400個描述語句。請注意,語言描述旨在為跟蹤提供輔助幫助。例如,如果追蹤器生成進一步處理的建議,那么語言規范可以作為全局語義指導,幫助減少它們之間的模糊性。

構建高質量密集跟蹤數據集的最大努力顯然是手動標記、雙重檢查和糾錯。為了完成這項任務,他們組建了一個注釋小組,包括幾個在相關領域工作的博士生和大約10名志愿者。

35個代表性跟蹤器的評估

他們沒有對如何使用LaSOT進行限制,但提出了兩種協議來評估跟蹤算法,并進行相應的評估。

方案一:他們使用1400個序列來評估跟蹤性能。研究人員可以使用除了LaSOT中的序列以外的任何序列來開發跟蹤算法。方案一旨在對跟蹤器進行大規模評估。

方案二:他們將LaSOT劃分為訓練和測試子集。根據80/20原則(即帕累托原則),他們從每類20個視頻中選出16個進行培訓,其余的進行測試。具體來說,訓練子集包含1120個視頻,2.83m幀,測試子集包含280個序列,690k幀。跟蹤程序的評估在測試子集上執行。方案二的目標是同時提供一大套視頻用于訓練和評估跟蹤器。

根據流行的協議(如OTB-2015[53]),他們使用OPE作為量化評估標準,并測量兩個協議下不同跟蹤算法的精度、標準化精度和成功率。他們評估了LaSOT上的35種算法,以提供廣泛客觀的基準,Tab. 3按時間順序總結這些跟蹤器及其表示方案和搜索策略。

表3:已評估跟蹤程序的摘要。

方案一評估結果

方案一旨在對LaSot的1400個視頻進行大規模評估。每個跟蹤器都按原樣用于評估,沒有任何修改。他們使用精度、標準化精度和成功率在OPE中報告評估結果,

圖3:利用精度、歸一化精度和成功率對一號方案下的算法量化評估。

圖4:在協議I下,追蹤器在三個最具挑戰性的屬性上的代表性結果。

圖5:六大典型挑戰序列上的的定性評價結果。

方案二評估結果

圖6:使用精度、標準化精度和成功率對方案II下的跟蹤算法評估。

根據方案二,他們將LaSOT分為訓練集和測試集。研究人員可以利用訓練集中的序列來開發他們的跟蹤器,并評估他們在測試集中的表現。為了提供測試集的基線和比較,他們評估了35種跟蹤算法。每個跟蹤器都被用于評估,沒有任何修改或再培訓。使用精度、歸一化精度和成功率的評價結果如圖6所示。

除了對每一種跟蹤算法進行評估外,他們還對兩種具有代表性的深跟蹤算法MDNET[42]和SIAMFC進行了重新培訓,并對其進行了評估。評估結果表明,這些跟蹤器在沒有重訓練的情況下具有相似的性能。一個潛在的原因是他們的重新培訓可能和原作者使用配置不同。

他們對SiamFC的LaSOT訓練集進行了再培訓,以證明使用更多的數據如何改進基于深度學習的跟蹤器。Tab. 4報告了OTB-2013和OTB-2015的結果,并與在ImageNet視頻上培訓的原始SIAMFC的性能進行了比較。請注意,使用彩色圖像進行培訓,并應用3個比例的金字塔進行跟蹤,即SIAMFC-3S(彩色)。表4為在LaSOT上對siamfc進行再培訓。

跟蹤在這兩個實驗中保持不變。他們在兩個評測集上觀察到了一致的性能提升,顯示了針對深度追蹤器的特定大規模訓練集的重要性。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1791

    文章

    47183

    瀏覽量

    238255
  • 計算機視覺
    +關注

    關注

    8

    文章

    1698

    瀏覽量

    45976
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24689

原文標題:352萬幀標注圖片,1400個視頻,亮風臺推最大單目標跟蹤數據集

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    使用Labview提供的.NET包的構造器節點選擇程序方法

    在使用Labvie的.NET包的構造器選構造器時,例如尋找NotifyIcon這個構造器,當不知道屬于哪個程序時,有沒有搜索的方法或者
    發表于 08-03 15:01

    labview構造器中嘗試程序發生錯誤

    請問下各位大蝦,有使用過構造器節點調用.NET做的dll文件嗎?為什么labview構造器中嘗試程序發生錯誤
    發表于 03-18 22:15

    建立開發和測試(總結)

    ? 被選擇作為開發和測試數據,應當與你未來計劃獲取并對其進行良好處理的數據有著相同的分布,而不一定和訓練
    發表于 12-14 10:56

    基于模糊和熵處理的顧客需求評估方法

    構建了顧客需求重要度評價模型,引入模糊理論表達并處理顧客需求信息,建立了市場競爭性評估決策矩陣,用熵處理的方法進行產品競爭性分析,提出基于模糊和熵處理的顧
    發表于 04-16 10:15 ?10次下載

    一種新的正形置換構造方法

    正形置換在密碼體制設計中應用廣泛。該文基于正形置換和正形拉丁方截的一一對應關系,研究了正形置換的構造問題,給出了由n元正形置換構造n+1元正形置換的新方法,該
    發表于 11-17 13:48 ?7次下載

    基于Vague的網絡安全態勢評估方法

    針對網絡安全態勢評估(NSSA)問題,提出一種基于Vague評估方法。首先,綜合攻防雙方對安全態勢的影響構建評估指標體系并給出指標權重的
    發表于 02-26 15:54 ?9次下載

    基于GBDT個人信用評估方法

    Tree(GBDT)的個人信用評估方法。GBDT天然可處理混合數據類型的數據,可以發現多種有區分性的特征以及特征組合,不需要做復雜的特征
    發表于 11-03 17:27 ?2次下載
    基于GBDT個人信用<b class='flag-5'>評估</b><b class='flag-5'>方法</b>

    云計算安全評估決策方法

    針對云計算安全評估動態性強的問題,提出一種可對云計算安全進行評估的區間猶豫模糊灰色妥協關聯分析決策方法。首先,為了準確衡量兩個區間猶豫模糊之間的距離,定義了新的區間猶豫模糊距離公式。
    發表于 11-24 16:24 ?0次下載

    基于多生成樹的MCDS構造算法

    無線網絡沒有固定基礎設施,節點之間通過洪泛方式尋找路由路徑以及傳輸數據,往往導致嚴重的廣播風暴以及通信干擾問題。為了避免上述問題,構造連通支配是解決方法之一。連通支配
    發表于 11-29 15:48 ?0次下載
    基于多生成樹的MCDS<b class='flag-5'>構造</b>算法

    基于多生成樹的MCDS構造算法

    無線網絡沒有固定基礎設施,節點之間通過洪泛方式尋找路由路徑以及傳輸數據,往往導致嚴重的廣播風暴以及通信干擾問題。為了避免上述問題,構造連通支配是解決方法之一。連通支配
    發表于 11-29 15:51 ?0次下載
    基于多生成樹的MCDS<b class='flag-5'>構造</b>算法

    一種改進的變精度粗糙漏洞威脅評估模型

    續屬性進行離散化處理;接下來,通過多次計算,調整參數a和b的值,進行屬性約簡并提取概率決策規則,構造決策規則庫;最后,將測試數據與規則庫進行匹配,得到漏洞威脅評估結果。仿真實驗表明,所提方法
    發表于 12-05 09:14 ?0次下載
    一種改進的變精度粗糙<b class='flag-5'>集</b>漏洞威脅<b class='flag-5'>評估</b>模型

    基于代數規格的面向對象蛻變關系構造方法

    針對面向對象軟件類級測試中方法序列調用時的Oracle問題,提出了一種基于代數規格的面向對象蛻變關系構造方法,并根據此方法進行蛻變測試。首先基于代數規格給出面向對象測試中蛻變關系的
    發表于 01-03 16:31 ?0次下載

    多標記數據特征提取方法的輸出核函數構造方法

    刻畫標記間的相關性;然后從損失函數的角度出發定義新的輸出核函數。第二種方法是利用互信息來度量標記間的兩兩相關性,在此基礎上進一步構造新的輸出核函數。3個多標記數據上2種分類器的實驗結
    發表于 01-07 10:28 ?0次下載

    零相關區高斯整數序列構造

    研究了具有零相關區的高斯整數序列構造方法。該方法基于二元正交矩陣,首先利用插零法構造出具有零相關區的三元序列
    發表于 01-10 16:33 ?0次下載

    基于模糊等價研究畢達哥拉斯模糊相似度構造方法

    基于模糊等價研究畢達哥拉斯模糊相似度的一般構造方法。將模糊等價概念推廣至畢達哥拉斯模糊數,提出了PFN( Pythagorean FuzzyNumber)模糊等價的概念,并給岀了PFN模糊等價的
    發表于 04-20 10:56 ?9次下載
    基于模糊等價研究畢達哥拉斯模糊<b class='flag-5'>集</b>相似度<b class='flag-5'>構造</b><b class='flag-5'>方法</b>
    主站蜘蛛池模板: 亚洲免费在线播放| 国产国语在线播放视频| 偷上邻居熟睡少妇| 久久香蕉国产线看观看精品| 动漫美女3d被爆漫画| 在线日本高清日本免费| 无码骚夜夜精品| 欧美亚洲韩日午夜| 久久草这里全是精品香蕉频线观| 超碰97人人做人人爱亚洲尤物| 永久免费观看视频| 午夜神器老司机高清无码| 女同给老师下媚药| 亚洲精品www久久久久久久软件| 国产成人ae在线观看网站站 | 国产手机在线精品| 精品一区二区三区色花堂| 蜜饯1V1高H-| 少妇久久久久久被弄高潮| 亚洲精品视频免费在线观看| 2019中文字幕乱码免费| 成人在线免费视频播放| 黑人寄宿羽月希产后奶水| 男生jj插入女生jj| 忘忧草研究所 麻豆| 在线观看国产视频| 日本19xxxx撤尿| 韩日美无码精品无码| 国产精品久久久久AV麻豆| 成人区精品一区二区不卡AV免费| 5580免费午夜福利院| 永久精品免费影院在线观看网站| 亚洲精品一区三区三区在线观看 | 国产扒开美女双腿屁股流白浆| 91久久精一区二区三区大全| 在线 中文字幕| 亚洲中文字幕日产乱码2020 | 国产一及毛片| 国产精品爽黄69天堂A片| 国产成人综合在线观看网站| 第四色男人天堂|