導讀
本文從五個需要進行標注的計算機視覺任務(物體檢測、線/邊緣檢測、分割、姿態預測、圖像分類)給大家介紹圖像標注的種類,應用場景,以及各種標注的優缺點。
介紹
“如果沒有數據分析,公司就會變得既盲又聾,就像高速公路上的鹿一樣在網絡上游蕩?!?/p>
— Geoffrey Moore
每個數據科學任務都需要數據。具體地說,是輸入系統的干凈易懂的數據。說到圖像,計算機需要看到人類眼睛看到的東西。
例如,人類有識別和分類物體的能力。同樣,我們可以使用計算機視覺來解釋它接收到的視覺數據。這就是圖像標注的作用。
圖像標注在計算機視覺中起著至關重要的作用。圖像標注的目標是為和任務相關的、特定于任務的標簽。這可能包括基于文本的標簽(類),繪制在圖像上的標簽(即邊框),甚至是像素級的標簽。我們將在下面探討這一系列不同的標注技術。
人工智能需要的人工干預比我們想象的要多。為了準備高精度的訓練數據,我們必須對圖像進行標注以得到正確的結果。數據注釋通常需要較高水平的領域知識,只有來自特定領域的專家才能提供這些知識。
需要標注的計算機視覺任務:
物體檢測
線/邊緣檢測
分割
姿態預測/關鍵點識別
圖像分類
1) 目標檢測
進行目標檢測的技術主要有兩種,即2D和3D包圍框。
對于多邊形物體,可以使用多邊形方法。讓我們詳細討論一下。
2D 包圍框
在這種方法中,只需要在被檢測的物體周圍繪制矩形框。它們用于定義對象在圖像中的位置。邊框可以由矩形左上角的x、y軸坐標和右下角的x、y軸坐標來確定。
優點和缺點:
標注起來快速和容易。
不能提供重要的信息,如物體的方向,這對許多應用來說是至關重要的。
包括不屬于物體一部分的背景像素。這可能會影響訓練。
3D 包圍框或者立方體
類似于2D邊框,除了它們還可以顯示目標的深度。這種標注是通過將二維圖像平面上的邊界框向后投影到三維長方體來實現的。它允許系統區分三維空間中的體積和位置等特征。
優點和缺點:
解決了物體方向的問題。
當物體被遮擋,這種標注可以想象包圍框的維度,這可能會影響訓練。
這種標注也會包括背景像素,可能會影響訓練。
多邊形
有時,必須標記形狀不規則的物體。在這種情況下,使用多邊形。注釋時只需標記物體的邊緣,我們就能得到要檢測的物體的完美輪廓。
優點和缺點:
多邊形標記的主要優點是它消除了背景像素,并捕獲了物體的精確尺寸。
非常耗時,如果物體的形狀是復雜的,很難標注。
注:多邊形方法也用于物體形狀的分割。我們將在下面討論分割。
數據采集是ML冷啟動的問題。但是,即使你有了一個可行的數據集,構建和測試模型也是需要技巧的。
2) 線/邊緣檢測(線和樣條)
在劃分邊界時,線和樣條是有用的。將區分一個區域和另一個區域的像素進行標注。
優點和缺點:
這種方法的優點是,連線上的像素不需要都是連續的。這樣在檢測有中斷的線或部分遮擋的物體是非常有用的。
手動標注圖像中的線是非常累人和費時的,特別是圖像中有很多的線的時候。
當物體碰巧是對齊的時候,可能會給出誤導的結果。
3) 姿態預測 / 關鍵點識別
在許多計算機視覺應用中,神經網絡常常需要識別輸入圖像中重要的感興趣的點。我們把這些點稱為地標或關鍵點。在這種應用中,我們希望神經網絡輸出關鍵點的坐標(x, y)。
4) 分割
圖像分割是將一幅圖像分割為多個部分的過程。圖像分割通常用于在像素級定位圖像中的物體和邊界。圖像分割方法有很多種。
語義分割: 語義分割是一項機器學習任務,它需要像素級標注,其中圖像中的每個像素都被分配給一個類。每個像素都帶有語義意義。這主要用于環境背景非常重要的情況。
實例分割: 實例分割是圖像分割的一種子類型,它在像素級別上標識圖像中每個物體的每個實例。實例分割和語義分割是圖像分割的兩種粒度級別之一。
全景分割: 全景分割結合了語義分割和實例分割,所有像素都被分配一個類標簽,所有目標實例都被唯一地分割。
5) 圖像分類
圖像分類不同于目標檢測。目標檢測的目的是識別和定位目標,而圖像分類的目的是識別和識別特定的目標類。這個用例的一個常見示例是對貓和狗的圖片進行分類。標注者必須為一只狗的圖像分配一個類標簽“dog”,對貓的圖像分配類標簽“cat”。
圖像標注的用例
在本節中,我們將討論如何使用圖像標注來幫助機器模型執行特定行業的任務:
零售:2D邊框可以用于標注產品的圖像,然后機器學習算法可以使用這些圖像來預測成本和其他屬性。圖像分類在這方面也有幫助。
醫學:多邊形可用于在醫用x射線中標記器官,以便將它們輸入深度學習模型,以訓練x射線中的畸形或缺陷。這是圖像標注最重要的應用之一,需要醫學專家具有較高的領域知識。
自動駕駛汽車:這是另一個重要的領域,圖像標注可以應用。利用語義分割對圖像中的每個像素進行標記,使車輛能夠感知到道路上的障礙物。這一領域的研究仍在進行中。
情緒檢測:這是里程碑,可以用來檢測一個人的情緒(高興,悲傷,或自然)。這可以應用于評估受試者對特定內容的情緒反應。
制造行業:線和樣條可用于標注工廠的圖像線跟隨機器人工作。這可以幫助自動化生產過程,人力勞動可以最小化。
圖像標注的一些挑戰
時間復雜度:手工標注圖像需要很多時間,機器學習需要大量的數據集,需要大量的時間來有效地標注這些基于圖像的數據集。
計算復雜度:機器學習需要精確標注的數據來運行模型。如果標注者在給圖像做標注的時候,注入任何一種錯誤,都可能會影響到訓練,所有的努力都可能付諸東流。
領域知識:如前所述,圖像標注通常需要特定領域的高級領域知識。因此,我們需要知道該標注什么的注解者,以及該領域的專家。
責任編輯:lq
-
圖像
+關注
關注
2文章
1086瀏覽量
40492 -
人工智能
+關注
關注
1792文章
47354瀏覽量
238811 -
數據分析
+關注
關注
2文章
1451瀏覽量
34071
原文標題:圖像標注的基礎內容介紹
文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論