編者按:文并不是逐字逐句翻譯,而是以更有利于中文讀者理解的目標,做了刪減、重構和意譯,并替換了多張不適合中文讀者的示意圖。
原文鏈接:https://medium.com/@paularamos_phd/journey-into-visual-ai-exploring-fiftyone-together-part-ii-getting-started-14cca5adfcd3
一,前言
上次我們介紹了《視覺AI之旅:一起探索 FiftyOne——第一部分丨簡介丨》,今天作為FiftyOne系列的第二篇,本文將帶您踏上使用這個開源工具包的激動人心的旅程,幫助您連接數據、模型和部署。也將展示FiftyOne如何在您處理2D圖像、3D點云或其他視覺數據時,為您的數據集解鎖真正的價值。咖啡數據集與AI工作流程的革新
二,咖啡數據集與AI工作流程的革新
1,從哥倫比亞咖啡數據集到現代機器學習應用
Paula Ramos博士曾在哥倫比亞與咖啡數據集合作,面臨數據集策劃、注釋和處理的諸多挑戰。本文將介紹FiftyOne如何轉變您的工作流程,加快AI生產過程,并從數據中提取可操作的洞察。
2,耗時的AI工作流程和看不見的復雜性
AI解決方案的開發始終是耗時的。我們經常在沒有完全理解數據中的模式、偏見或噪聲的情況下收集數據集。FiftyOne可以幫助我們理解這些復雜性如何影響AI方程。
3,咖啡愛好者的數據集
本文將使用我的一個數據集——用智能手機相機拍攝的咖啡樹枝圖像集合。目標是使用語義分割任務計算樹枝上的咖啡果實數量。
三,為什么選擇FiftyOne?
FiftyOne是一個基于Python的API(SDK)和GUI(APP),允許您使用可操作的命令探索、策劃和分析數據集。以下是一些FiftyOne的功能,您可以在我的筆記本上復制這些操作。
1,隨機打亂數據集
import fiftyone as fo from fiftyone.utils.coco import COCODetectionDatasetImporter dataset = fo.Dataset.from_dir( dataset_type=fo.types.COCODetectionDataset, dataset_dir="./colombian_coffee", data_path="images/default", labels_path="annotations/instances_default.json", label_types="segmentations", label_field="categories", name="coffee", include_id=True, overwrite=True ) view = dataset.shuffle()
2,使用fiftyone brain了解您的數據集
FiftyOne的fiftyone brain功能可以幫助您理解數據集,識別潛在偏見,可視化實驗關系。
3,發現獨特性
import fiftyone.brain as fob fob.compute_uniqueness(dataset) # 探索最獨特的樣本 session.view = dataset.sort_by("uniqueness", reverse=True) # 探索最不獨特的樣本 session.view = dataset.sort_by("uniqueness") 4. 利用相似性搜索 python fob.compute_similarity( dataset, model="clip-vit-base32-torch", brain_key="img_sim", )
4,嵌入可視化
fob.compute_visualization(dataset, brain_key="img_viz")
四,總結
盡管目前我們在計算機視覺和機器學習方面取得了進步,但數據質量、生產時間和可擴展性等挑戰仍然存在。FiftyOne通過提供以數據為中心的AI方法來解決這些挑戰。
敬請期待下一篇文章,我們將探索FiftyOne的核心功能,操作數據集,并評估模型。讓我們將這次與FiftyOne的旅程變成一個協作和豐富的體驗。編程愉快!
我們期待聽到您的經驗!請在評論區分享您的看法,您的見解可能會幫助我們在下一篇文章中幫助他人。
如果你有更好的文章,歡迎投稿!
稿件接收郵箱:nami.liu@pasuntech.com
更多精彩內容請關注“算力魔方?”!
審核編輯 黃宇
-
AI
+關注
關注
87文章
31335瀏覽量
269704
發布評論請先 登錄
相關推薦
評論