亚洲色图 p,特级一级全黄毛片免费,污污免费

作者：楊亦誠

前言

通常情況下，新模型發布后，其對應的 github 倉庫中都會有提供自定數據集訓練的任務腳本，開發者可以基于自己的數據集，快速實現對該模型結構的訓練與驗證。但往往這些訓練腳本僅支持部分的數據集格式，例如 YOLOv8 的官方倉庫，就是需要開發者的數據集格式滿足 Ultralytics 標準，或是手動編寫腳本進行，將原本的數據集格式轉化為 Ultralytics 格式，但這部分工作其實并不影響模型訓練后的部署效果，因此如果有一個工具幫助我們非常便捷地進行訓練數據的管理與格式轉換，將大大提升模型訓練的生產效率。

Datumaro 套件介紹

項目地址：

https://github.com/openvinotoolkit/datumaro

Datumaro 是一個支持 Python 和命令行調用兩種調用方式的標注數據管理工具。它可以支持以下功能：

1. 標注數據格式雙向轉換

可以適用于分類，分割，檢測，關鍵點檢測，文本定位，文本識別、重識別以及點云任務的數據處理，支持以下標注數據格式的互相轉換：

CIFAR-10/100(classification)

Cityscapes

COCO(image_info,instances,person_keypoints,captions,labels,panoptic,stuff)

CVAT

ImageNet

Kitti(segmentation,detection,3D raw/velodyne points)

LabelMe

LFW(classification,person re-identification,landmarks)

MNIST(classification)

Open Images

PASCALVOC(classification,detection,segmentation,action_classification,person_layout)

TF Detection API(bboxes,masks)

YOLO(bboxes)

2. 構建并修改數據集

多個數據集合并

數據集標簽過濾，例如刪除特定標簽的圖片

修改數據集標簽

數據集分割，例如訓練集、驗證集與測試集

數據集采樣，例如基于 Entropy 的方法篩選合適的訓練集樣本

Datumaro 套件實踐

Datumaro 是支持命令行調用的模式，因此我們可以非常方便地使用 1 行命令完成 2 種不同格式數據的轉換，下面我將基于命令行模式，演示一下 Datumaro 處理標注數據格式轉化時的基本方法。

1Datumaro 安裝與基本使用方法

Datumaro 支持基于 PyPI 的安裝方式，如果想在第一時間體驗最新的功能也可以基于 github 倉庫直接安裝：

 # From PyPI:
$ pip install datumaro[default] 
$ pip install 'git+https://github.com/openvinotoolkit/datumaro[default]'

向右滑動查看完整代碼

Datumaro 的命令行調用方法非常簡單，如果你已經有了一組標準格式的數據集，只需要在命令行中定于原始數據格式和路徑，以及轉換后的數據格式及路徑即可：

 $ datum convert -if voc -i -f coco -o

向右滑動查看完整代碼

2YOLOv8 目標檢測數據集實戰

正好最近在準備表計識別的項目，這里借用一下飛槳提供的表計檢測數據集，目標是使用 YOLOv8 模型構建表盤目標檢測任務。

數據集下載地址：

https://bj.bcebos.com/paddlex/examples/meter_reader/datasets/meter_det.tar.gz

下載數據集后可以看到文件目錄結構如下：

├── meter_det
│  ├── annotations
│      ├── instance_train.json
│      └── instance_test.json
│  ├── test
│  └── train

向右滑動查看完整代碼

其實中 train 和 test 目錄下分別保存了圖片格式的訓練數據和驗證數據：

├── test
│  ├── 20190822_105.jpg
│  ├── 20190822_110.jpg
│  ├── 20190822_123.jpg
│  ├── 20190822_124.jpg
│  ├── 20190822_127.jpg
│  ├── …

向右滑動查看完整代碼

第一步我們可先先使用 datum 命令自動識別一下該數據集的格式：

$ datum detect './meter_det'  
輸出：Detected format: image_dir

向右滑動查看完整代碼

可以看到由于該數據集并沒有符合某類標準的格式規范，因此 Datumaro 將其判斷為普通的圖片文件夾。這里我可以手動查詢幾種數據集的標準格式，找到和原始數據集最相似的一種，然后進行手動修改。通過對于 Datumaro 支持的幾種數據格式標準進行查詢：

https://openvinotoolkit.github.io/datumaro/latest/docs/data-formats/supported_formats.html

我們發現原始數據的格式和COCO最為類似：

└─ Dataset/
  ├── dataset_meta.json # a list of custom labels (optional)
  ├── images/
  │  ├── train/
  │  │  ├──
  │  │  ├──
  │  │  └── ...
  │  └── val/
  │    ├──
  │    ├──
  │    └── ...
  └── annotations/
    ├── _.json
    └── ...

向右滑動查看完整代碼

所以我們手動對原始目錄進行略微改造，增加一個images目錄用于單獨存放圖片數據，改造結果如下：

├── meter_det_coco
│  ├── annotations
│      ├── instances_train.json
│      └── instances_val.json
│  └── images
  ├── train
└── val

向右滑動查看完整代碼

這里有個容易被忽略的點，因為 Datumaro 會根據 .json 標簽文件的文件名來判斷該數據集的用途，例如檢測或者分割，所以我們一定要將示例中部分的名字改為 “instances”，接下來我們再使用 detect 方法檢測下修改后的數據集類型：

$ datum detect './meter_det_coco' 
輸出：Detected format: coco

向右滑動查看完整代碼

可以看到 Datumaro 已經將其識別為標準的 COCO 格式類型。最后我們就可以調用之前提到的命令一鍵完成對數據集從 COCO 到 Ultralytics 標準的轉換：

$ datum convert -if coco -i '/home/ethan/intel/data/meter_det_coco' -f yolo_ultralytics -o '/home/ethan/intel/data/meter_det_yolo' -- --save-media

向右滑動查看完整代碼

P.S: --save-media 自動將圖片文件復制到新的數據集目錄下

轉換后的數據集目錄如下：

├── meter_det_yolo
│  ├── data.yaml
│  ├── images
│  │  ├── train
│  │  └── val
│  ├── labels
│  │  ├── train
│  │  └── val
│  ├── train.txt
│  └── val.txt
└── table.jpg

向右滑動查看完整代碼

有了這樣一個 Ultralytics 標準數據集后，我們就可以直接將其對應的路徑放到 YOLOv8 倉庫中的配置文件中，然后開啟訓練腳本進行模型創建。

model.train(data=' data.yaml ', epochs=100, imgsz=640)

向右滑動查看完整代碼

總結

Datumaro 是一個非常強大的標注數據管理工具，幫助開發者在各種數據標準間輕松實現格式的互相轉換，并實現對這些數據集的有效管理和改造，大大提升了既有數據集的復用性，完成對新模型效果進行快速驗證。

審核編輯：湯梓紅

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

英特爾

英特爾

+關注

關注
61

文章
9949

瀏覽量
171692
數據格式

數據格式

+關注

關注
0

文章
29

瀏覽量
8891
模型

模型

+關注

關注
1

文章
3226

瀏覽量
48807
腳本

腳本

+關注

關注
1

文章
389

瀏覽量
14858
GitHub

GitHub

+關注

關注
3

文章
468

瀏覽量
16428

原文標題：一個工具搞定標注數據格式轉換 | 開發者實戰

文章出處：【微信號：英特爾物聯網，微信公眾號：英特爾物聯網】歡迎添加關注！文章轉載請注明出處。

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

一個工具搞定標注數據格式轉換

評論

請問TLV320AIC3268的ADC轉換后的數據格式是什么樣的？

ADC3561轉換成什么數據格式便于高速實時通過WIFI發送？

【中級】labview每日一教【11.21】TDMS數據格式

數據格式如何修改

標準測試數據格式STDF你了解多少

JSON 數據格式

數據格式不同，如何在轉換求均值

串口的數據格式

海洋環境信息數據格式分析研究

數據格式,計算機中數據格式詳細介紹

新型數據格式轉換的FPGA實現

gps數據格式含義說明

MDB-RS232適配器數據格式分析

串口通訊的基本概念、數據格式

一個工具搞定標注數據格式轉換