色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用于圖像分類和物體檢測的深度學習

jf_pJlTbmA9 ? 來源: NVIDIA ? 作者: NVIDIA ? 2023-07-05 16:30 ? 次閱讀

這個Dataiku platform日常人工智能簡化了深度學習。用例影響深遠,從圖像分類到對象檢測和自然語言處理( NLP )。 Dataiku 可幫助您對代碼和代碼環境進行標記、模型培訓、可解釋性、模型部署以及集中管理。

本文深入探討了用于圖像分類和對象檢測的高級 Dataiku 和 NVIDIA 集成。它還涵蓋了實時推理的深度學習模型部署以及如何使用開源RAPIDS和 cuML 庫,用于客戶支持 Tweet 主題建模用例。 NVIDIA 提供硬件 (NVIDIA A10 Tensor Core GPUs,在這種情況下)和各種 OSS(CUDA,RAPIDS) 完成工作

請注意,本文中的所有 NVIDIA AI 軟件都可以通過NVIDIA AI Enterprise,一個用于生產人工智能的安全端到端軟件套件,由 NVIDIA 提供企業支持

用于圖像分類和物體檢測的深度學習

本節介紹使用 Dataiku 和 NVIDIA GPU 訓練和評估用于圖像分類或對象檢測的深度學習模型的步驟

無代碼方法

從 Dataiku 11.3 開始,您可以使用可視化的無代碼工具來實現圖像分類或對象檢測工作流程的核心領域。您可以使用本地 web 應用程序標記圖像、繪制邊界框和查看/管理注釋。圖像標記是訓練性能模型的關鍵:→ 很好的模型。

使用 Dataiku 的圖像標記工具,您可以將所有貓標記為“貓”,或者更精細地標記,以適應獨特的外表或個性特征

Dataiku 使您能夠訓練圖像分類和對象檢測模型,特別是使用遷移學習來微調基于自定義圖像/標簽/邊界框的預訓練模型。數據增強重新著色、旋轉和裁剪訓練圖像是增加訓練集大小并將模型暴露在各種情況下的常用方法。

EfficientNet (圖像分類)和 Faster R-CNN (對象檢測)神經網絡可以在模型再訓練用戶界面中與預先訓練的權重一起使用,開箱即用。

在將模型訓練為自定義圖像標簽和邊界框之后,可以使用疊加的熱圖模型焦點來解釋模型的預測。

一旦您對模型的性能感到滿意,就將經過訓練的模型作為容器化推理服務部署到 Kubernetes 集群中。這是由 Dataiku API Deployer 工具管理的。

計算發生在哪里?

Dataiku 可以將深度學習模型訓練、解釋和推理背后的所有計算推送給 NVIDIA PyTorch (圖 4 )。您甚至可以通過 GPU 利用多個 GPU 進行分布式培訓DistributedDataParallel模塊和 TensorFlowMirroredStrategy.

dataiku-deep-learning-model-training-interface-625x552.png 圖 4 。使用 Dataiku 接口激活 NVIDIA GPU 進行深度學習模型訓練

通過Dataiku Elastic AI集成。首先,將您的 Dataiku 實例連接到具有 NVIDIA GPU 資源(通過 EKS 、 GKE 、 AKS 、 OpenShift 管理)的 Kubernetes 集群。然后 Dataiku 將創建 Docker 鏡像并在后臺部署容器

深度學習訓練和推理作業可以在 Kubernetes 集群上運行,也可以在任意 Python 代碼或 Apache Spark 作業上運行。

對模型訓練腳本進行編碼

如果你想在 Python 中自定義你自己的深度學習模型,可以嘗試在 MLflow 實驗跟蹤器中封裝一個 train 函數。圖 6 顯示了一個基于 Python 的流程。請參閱中的機器學習教程Dataiku Developer Guide例如。這種方法提供了自定義代碼的完全靈活性,以及一些開箱即用的實驗跟蹤、模型分析可視化,以及 Dataiku 中經過可視化訓練的模型的點擊式模型部署

自定義 Python 深度學習模型可以通過容器化執行來利用 NVIDIA GPU ,就像 Dataiku 中經過視覺訓練的深度學習模型一樣(圖 7 )。

python-script-in-dataiku-containerized-compute-options.png 圖 7 。 Dataiku 中的任何 Python 工作負載都可以推送到具有 NVIDIA GPU 資源的 Kubernetes 集群

用于實時推理的模型部署

一旦模型經過訓練,就到了部署它進行實時推理的時候了。如果您使用 Dataiku 的視覺圖像分類、對象檢測或帶有 MLflow 的自定義編碼模型,然后作為 Dataiku 模型導入,只需單擊幾下即可在經過訓練的模型上創建容器化推理 API 服務。

首先,將 Dataiku API Deployer 工具連接到 Kubernetes 集群,以托管這些推理 API 服務,同樣在集群節點中提供 NVIDIA GPU 。然后在負載均衡器后面部署容器化服務的 1-N 個副本。從這里開始,邊緣設備可以向 API 服務發送請求,并接收來自模型的預測。圖 8 顯示了整個體系結構。

dataiku-trained-model-workflow.png create API service in the API Designer > push the API service to the Deployer > push the API Service to a K8S cluster with NVIDIA GPU resources. From there, edge devices can submit requests to the API service with data, images, and receive predictions back.” width=”1262″ height=”589″> 圖 8 。從在 Dataiku 中訓練的模型到托管在具有 NVIDIA GPU 的 Kubernetes 集群上的 API 服務的工作流,用于推理

教程:在 Dataiku 中使用帶有 RAPIDS 的 BERT 模型加速主題建模

為了更深入地了解,本節將介紹如何在 Dataiku 中設置 Python 環境,以便將 BERTopic 與 RAPIDS 中的 GPU 加速 cuML 庫一起使用。它還強調了使用 cuML 獲得的性能增益

此示例使用Kaggle Customer Support on Twitter dataset以及主題建模的關鍵客戶投訴主題。

步驟 1 。準備數據集

首先,通過刪除標點符號、停止詞和詞尾詞來規范推文文本。還要將數據集過濾為客戶在推特上用英語發布的投訴。所有這些都可以使用 Dataiku 可視化配方來完成。

使用拆分配方從初始用戶推文中過濾公司的回復。接下來,使用 Dataiku 的Text Preparation plugin檢測用戶推文中語言分布的配方。



使用過濾配方過濾掉所有非英語和空白的推文。一定要使用文本準備方法來過濾停止詞、標點符號、 URL 、表情符號等。將文本轉換為小寫。

最后,使用分割配方來分割用于訓練和測試的數據(簡單的 80% / 20% 隨機分割)。

步驟 2 。使用 BERTopic 和 RAPIDS 庫設置 Python 環境

運行 Python 進程需要一個具有 NVIDIA GPU 的彈性計算環境BERTopic package(及其所需的包裝),以及 RAPIDS 容器圖像。此示例使用 Amazon EKS 集群(實例類型: g4dnNVIDIA A10 Tensor Core GPUs) ,RAPIDS Release Stable 22.12和 BERTopic ( 0.12.0 )。

首先,在 Dataiku 中啟動一個 EKS 集群。設置集群后,您可以在“管理”下的“集群”選項卡中檢查其狀態和配置。

BER 主題

使用 Dataiku 的托管虛擬代碼環境,使用 BERTopic 及其所需的包創建 Dataiku 代碼環境。

RAPIDS

使用 Docker Hub 中的 RAPIDS 映像構建一個容器環境。在 Dataiku 中,為您的代碼環境使用 Dataiku 基本映像,或者從 DockerHub 或NGC。然后,將您的 Dataiku 代碼環境附加到它。請注意, NVIDIA 已經在 PyPi 上發布了 RAPIDS ,所以您現在可以只使用默認的 Dataiku 基本映像。

步驟 3 。使用默認 UMAP 運行 BERTopic

接下來,使用 BERTopic 從 Twitter 投訴中找出前五個話題。要在 GPU 上加速 UMAP 進程,請使用 cuML UMAP 。默認 UMAP 如下所示:

# -------------------------------------------------------------------------------- NOTEBOOK-CELL: CODE
# -*- coding: utf-8 -*-
import dataiku
import pandas as pd, numpy as np
from dataiku import pandasutils as pdu
from bertopic import BERTopic

# -------------------------------------------------------------------------------- NOTEBOOK-CELL: CODE
# Read the train dataset in the dataframe and the variable sample_size which defines the number of records to be used
sample_size = dataiku.get_custom_variables()["sample_size"]
train_data = dataiku.Dataset("train_cleaned")
train_data_df = train_data.get_dataframe(sampling='head',limit=sample_size)

# -------------------------------------------------------------------------------- NOTEBOOK-CELL: CODE
# Create Bertopic object and run fit transform
topic_model = BERTopic(calculate_probabilities=True,nr_topics=4)
topics, probs = topic_model.fit_transform(train_data_df["Review Description_cleaned"])
all_topics_rapids_df = topic_model.get_topic_info()

# -------------------------------------------------------------------------------- NOTEBOOK-CELL: CODE
#Write the List of Topics output as a DSS Dataset

Topic_Model_df = all_topics_rapids_df 
Topic_Model_w_Rapids = dataiku.Dataset("Topic_Model")
Topic_Model_w_Rapids.write_with_schema(Topic_Model_df)


RAPIDS cuML UMAP:

# -*- coding: utf-8 -*-
import dataiku
import pandas as pd, numpy as np
from dataiku import pandasutils as pdu

from bertopic import BERTopic
from cuml.manifold import UMAP
from cuml.cluster.hdbscan.prediction import approximate_predict

# -------------------------------------------------------------------------------- NOTEBOOK-CELL: CODE
# Read the train dataset in the dataframe and the variable sample_size which defines the number of records to be used
sample_size = dataiku.get_custom_variables()["sample_size"]
train_data = dataiku.Dataset("train_cleaned")
train_data_df = train_data.get_dataframe(sampling='head',limit=sample_size)

# -------------------------------------------------------------------------------- NOTEBOOK-CELL: CODE
# Create a cuML UMAP Obejct and pass it in the Bertopic object and run fit transform
umap_model = UMAP(n_components=5, n_neighbors=15, min_dist=0.0)
cu_topic_model = BERTopic(calculate_probabilities=True,umap_model=umap_model,nr_topics=4)
cu_topics, cu_probs = cu_topic_model.fit_transform(train_data_df["Review Description_cleaned"])
all_topics_rapids_df = cu_topic_model.get_topic_info()

# -------------------------------------------------------------------------------- NOTEBOOK-CELL: CODE
# Write the List of Topics output as a DSS Dataset

Topic_Model_w_Rapids_df = all_topics_rapids_df 
Topic_Model_w_Rapids = dataiku.Dataset("Topic_Model_w_Rapids")
Topic_Model_w_Rapids.write_with_schema(Topic_Model_w_Rapids_df)

UMAP 對整個計算時間有很大貢獻。在帶有 cuML RAPIDS 的 NVIDIA GPU 上運行 UMAP 可實現 4 倍的性能提升。可以通過在 GPU 上運行更多的算法來實現額外的改進,例如使用 cuML HDBSCAN 。

不帶 RAPIDS 的主題建模過程 運行時
不帶 RAPIDS 12 分 21 秒
帶 RAPIDS 2 分 59 秒

表 1 。使用 RAPIDS AI 進行配置可實現 4 倍的性能提升

步驟 4 。投訴聚類儀表板

最后,您可以在 Dataiku 中的輸出數據集(帶有干凈的 Tweet 文本和主題)上構建各種看起來很酷的圖表,并將其推送到儀表板上進行執行團隊審查(圖 13 )。



圖 13 。 Dataiku 儀表板在一個中心位置顯示各種指標

把它們放在一起

如果您希望將深度學習用于圖像分類、對象檢測或 NLP 用例, Dataiku 可以幫助您標記、模型訓練、可解釋性、模型部署以及集中管理代碼和代碼環境。與最新的 NVIDIA 數據科學庫和計算硬件的緊密集成構成了一個完整的堆棧。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4994

    瀏覽量

    103156
  • 人工智能
    +關注

    關注

    1791

    文章

    47350

    瀏覽量

    238750
收藏 人收藏

    評論

    相關推薦

    華為云ModelArts入門開發(完成物體分類物體檢測)

    利用ModelArts框架可以完成圖像分類物體檢測、預測分析、聲音分類、文本分類等功能。介紹如何使用ModelArts完成
    的頭像 發表于 07-10 16:26 ?1715次閱讀
    華為云ModelArts入門開發(完成<b class='flag-5'>物體</b><b class='flag-5'>分類</b>、<b class='flag-5'>物體檢測</b>)

    深度學習DeepLearning實戰

    內容2:課程一: Tensorflow入門到熟練:課程二:圖像分類:課程三:物體檢測:課程四:人臉識別:課程五:算法實現:1、卷積神經網絡CNN2、循環神經網絡RNN3、強化學習DRL
    發表于 01-09 17:01

    深度強化學習實戰

    內容2:課程一: TensoRFlow入門到熟練:課程二:圖像分類:課程三:物體檢測:課程四:人臉識別:課程五:算法實現:1、卷積神經網絡CNN2、循環神經網絡RNN3、強化學習DRL
    發表于 01-10 13:42

    基于深度學習和3D圖像處理的精密加工件外觀缺陷檢測系統

    的要求; 創新點三:深度學習用于3D圖像的分析處理。直接聯通三維圖像數據與深度
    發表于 03-08 13:59

    設計一個紅外物體檢測設備

    描述使用 PIR 傳感器的紅外物體檢測設備-PCB 設計項目背后的動機:這種物體檢測傳感器專門設計用于防止未經授權的物體或身體進入。在您不在的情況下,除非您允許,否則它不會讓任何人進入
    發表于 06-27 06:18

    討論紋理分析在圖像分類中的重要性及其在深度學習中使用紋理分析

    地執行基于紋理特征的分類任務。為了讓深度學習在基于紋理的數據上更好地工作,需要有一種方法,可以從圖像中提取紋理特定的特征,并將其傳遞給全連接層,同時保留全局特征。這樣的架構設置將使全連
    發表于 10-26 16:57

    基于運動估計的運動物體檢測技術研究

    運動物體檢測圖像處理和分析系統的關鍵技術,為了能夠更準確的檢測視頻流中的運動物體,本文提出了一種基于運動估計的運動物體檢測方法,該方法以運
    發表于 12-14 13:37 ?16次下載

    圖像分類的方法之深度學習與傳統機器學習

    實際情況非常復雜,傳統的分類方法不堪重負。現在,我們不再試圖用代碼來描述每一個圖像類別,決定轉而使用機器學習的方法處理圖像分類問題。 目前,
    發表于 09-28 19:43 ?0次下載

    深度學習在計算機視覺上的四大應用

    計算機視覺中比較成功的深度學習的應用,包括人臉識別,圖像問答,物體檢測物體跟蹤。
    的頭像 發表于 08-24 16:16 ?4837次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>在計算機視覺上的四大應用

    傳統檢測深度神經網絡框架、檢測技術的物體檢測算法全概述

    物體檢測一向是比較熱門的研究方向,它經歷了傳統的人工設計特征+淺層分類器的框架,到基于大數據和深度神經網絡的End-To-End的物體檢測框架的發展,然而許多人其實并未系統的了解過
    的頭像 發表于 10-22 15:07 ?2729次閱讀
    傳統<b class='flag-5'>檢測</b>、<b class='flag-5'>深度</b>神經網絡框架、<b class='flag-5'>檢測</b>技術的<b class='flag-5'>物體檢測</b>算法全概述

    深度學習圖像分割的方法和應用

    介紹使圖像分割的方法,包括傳統方法和深度學習方法,以及應用場景。 基于人工智能和深度學習方法的現代計算機視覺技術在過去10年里取得了顯著進展
    的頭像 發表于 11-27 10:29 ?3188次閱讀

    詳解深度學習圖像分割

    基于人工智能和深度學習方法的現代計算機視覺技術在過去10年里取得了顯著進展。如今,它被用于圖像分類、人臉識別、
    的頭像 發表于 01-06 15:50 ?3696次閱讀

    基于PyTorch的深度學習入門教程之PyTorch的安裝和配置

    深度神經網絡是一種目前被廣泛使用的工具,可以用于圖像識別、分類物體檢測,機器翻譯等等。深度
    的頭像 發表于 02-16 15:15 ?2608次閱讀

    淺析FPGA的圖像采集和快速移動物體檢測

    提出了一種圖像采集和快速移動物體檢測的設計,即通過FPGA實現對攝像頭的初始化及數據采集,并通過自定義的傳輸
    的頭像 發表于 05-12 15:29 ?3139次閱讀
    淺析FPGA的<b class='flag-5'>圖像</b>采集和快速移動<b class='flag-5'>物體檢測</b>

    分享使用圖像分割來做缺陷檢測的一個例子

    1. 介紹 什么是物體檢測? 給定一張圖像,我們人類可以識別圖像中的物體。例如,我們可以檢測圖像
    的頭像 發表于 05-29 10:08 ?2601次閱讀
    分享使用<b class='flag-5'>圖像</b>分割來做缺陷<b class='flag-5'>檢測</b>的一個例子
    主站蜘蛛池模板: 久久精品黄色| 蜜桃成人在线| 德国xxxx| 国产精品久久久久无码AV色戒 | 中文字幕 人妻熟女| 99亚洲精品| 放射源分类办法| 国产亚洲精品久久7777777| 久久综合视频网站| 色戒在线完整观看在线播放版| 亚洲 欧美 中文 日韩 另类| 影音先锋av丝袜天堂| 成人手机在线| 亚洲中文字幕在线精品| 99久久精品国产亚洲AV| 国产欧美一区二区精品仙草咪| 久久丫线这里只精品| 色多多污污版免费下载安装| 背着老婆爆操性感小姨子| 九九精品视频在线播放| 日本中文字幕巨大的乳专区| 美女被日出水| 亚洲精品久久久久久蜜臀| 99久久国内精品成人免费| 男人扒开添女人下部口述| 亚洲黄色三级视频| 精品极品三大极久久久久| 爽娇妻快高h| 99久久就热视频精品草| 情浓野战台湾三级| 97久久超碰中文字幕| 国产在线一卡二卡| 色窝窝777欧美午夜精品影院| 777米奇影院第七色色| 精品福利一区| 午夜伦伦电影理论片费看| a级老头和老太xxxx| 三级视频网站| 精品久久伊人| mm625亚洲人成电影网| 欧美黑人巨大xxxxx|