色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用 Vision Transformer 和 NVIDIA TAO,提高視覺 AI 應(yīng)用的準(zhǔn)確性和魯棒性

NVIDIA英偉達(dá) ? 來(lái)源:未知 ? 2023-08-04 17:40 ? 次閱讀

wKgaomToPL6AR5_FAHaFzxWEe4k031.gif

Vision Transformer(ViT)正在席卷計(jì)算機(jī)視覺領(lǐng)域,提供令人難以置信的準(zhǔn)確性、復(fù)雜現(xiàn)實(shí)場(chǎng)景下強(qiáng)大的解決方案,以及顯著提升的泛化能力。這些算法對(duì)于推動(dòng)計(jì)算機(jī)視覺應(yīng)用的發(fā)展發(fā)揮了關(guān)鍵作用,而 NVIDIA 則通過(guò) NVIDIA TAO Toolkit NVIDIA L4 GPU,使應(yīng)用集成ViT 變得輕而易舉。

ViT 的不同之處

ViT 是一種將原本用于自然語(yǔ)言處理的 Transformer 架構(gòu)應(yīng)用于視覺數(shù)據(jù)的機(jī)器學(xué)習(xí)模型。相比基于 CNN 的同類模型具有一些優(yōu)勢(shì),并能夠并行處理大規(guī)模輸入的數(shù)據(jù)。CNN 采用的是局部操作,因而缺乏對(duì)圖像的全局理解;而 ViT 則以并行和基于自注意的方式來(lái)有效地處理圖像,使得所有圖像塊之間能夠相交互,從而提供了長(zhǎng)程依賴和全局上下文的能力。

圖 1 展示了 ViT 模型中的圖像處理流程。輸入圖像被分為較小的固定尺寸的圖塊,之后這些圖塊被展平并轉(zhuǎn)換為一系列的標(biāo)記 (tokens) 。這些標(biāo)記連同位置編碼一起被輸入到 Transformer 編碼器中,該編碼器由多個(gè)自注意力和前饋神經(jīng)網(wǎng)絡(luò)組成。

wKgaomToPL6AXQOnAAFu83nqZ0w667.png

圖 1. 包含位置編碼器和編碼器的 ViT 模型處理圖像

通過(guò)自注意力機(jī)制,每個(gè)標(biāo)記或圖塊與其他標(biāo)記進(jìn)行交互,以決定哪些標(biāo)記是重要的。這有助于模型捕捉標(biāo)記之間的關(guān)系和依賴,并學(xué)習(xí)哪些標(biāo)記是更重要的。

例如在有一只鳥的圖像中,模型會(huì)更關(guān)注重要的特征,比如眼睛、鳥嘴和羽毛等,而不是背景。這使得訓(xùn)練更加高效,增強(qiáng)了對(duì)圖像損壞和噪聲情況的魯棒性,并在未見過(guò)的物體上表現(xiàn)出更優(yōu)越的泛化能力。

為何 ViT 對(duì)計(jì)算機(jī)

視覺應(yīng)用至關(guān)重要

真實(shí)世界的環(huán)境具有多樣且復(fù)雜的視覺模式。與 CNN 不同,ViT 憑借自身的可擴(kuò)展性和適應(yīng)性,能夠處理各種任務(wù),而且無(wú)需針對(duì)具體的任務(wù)調(diào)整架構(gòu)。

wKgaomToPL6AZ6y6AAXFPe2hYdU465.png

圖 2. 各種不完美和嘈雜的

現(xiàn)實(shí)數(shù)據(jù)給圖像分析帶來(lái)了難題

在下面的視頻中,我們比較了基于 CNN 和 ViT 的模型的噪聲視頻。在任何情況下,ViT 模型表現(xiàn)都優(yōu)于 CNN 模型。

視頻 1. 了解 SegFormer,這是一個(gè)

結(jié)合高效率和穩(wěn)健語(yǔ)義分割能力的 ViT 模型

將 ViT 與 TAO Toolkit 5.0 集成

TAO 是一個(gè)低代碼 AI 工具包,用于構(gòu)建和加速視覺 AI 模型,可用于輕松地構(gòu)建和集成 ViT 到應(yīng)用和 AI 工作流程中。用戶可以通過(guò)簡(jiǎn)單的界面和配置文件快速開始訓(xùn)練 ViT,無(wú)需深入了解模型架構(gòu)。

TAO Toolkit 5.0 提供幾種常用于計(jì)算機(jī)視覺任務(wù)的先進(jìn) ViT,包括:

全注意力網(wǎng)絡(luò)(FAN)

FAN 是由 NVIDIA 研究團(tuán)隊(duì)開發(fā)的一系列基于 Transformer 架構(gòu)的神經(jīng)網(wǎng)絡(luò)主干模型。該系列模型在對(duì)抗各種干擾方面達(dá)到了當(dāng)前技術(shù)水平的最佳程度,如表格 1 所示。這些主干模型能夠輕松適應(yīng)新的領(lǐng)域,對(duì)抗噪聲和模糊。表格 1 展示了所有 FAN 模型在 ImageNet-1K 數(shù)據(jù)集上所達(dá)到的準(zhǔn)確率,無(wú)論是干凈版本還是經(jīng)過(guò)干擾處理后的版本。

wKgaomToPL6AVn7BAAAxlWxNk-4355.png

表 1. FAN 模型的大小和準(zhǔn)確性

全局上下文 Vision Transformer (GC-ViT)

GC-ViT 是 NVIDIA 研究部門開發(fā)的一種具有極高準(zhǔn)確性和計(jì)算效率的新型架構(gòu)。該架構(gòu)解決了 Vision Transformer 中缺乏歸納偏置的問(wèn)題。通過(guò)使用局部自注意力機(jī)制,GC-ViT 在參數(shù)較少的情況下在 ImageNet 上取得更好的結(jié)果,同時(shí)結(jié)合全局自注意力,可以實(shí)現(xiàn)更好的局部和全局空間交互。

wKgaomToPL-AaAcLAAAwtKQJ92g384.png

表 2. GC-ViT 模型的大小和準(zhǔn)確性

帶有改進(jìn)后去噪錨框的檢測(cè) Transformer(DINO)

DINO 是最新一代的檢測(cè)變換器(DETR),其訓(xùn)練收斂速度比其他 ViT 和 CNN 更快。在 TAO 工具套件中,DINO 十分靈活,可以與傳統(tǒng) CNN(例如 ResNets)和基于 Transformer 的骨干網(wǎng)絡(luò)(如 FAN)和 GC-ViT 等相結(jié)合。

wKgaomToPL-ASKEWAADXYXf-6Sw823.png

圖 3. DINO 與其他模型的準(zhǔn)確性比較

Segformer

Segformer 是一個(gè)輕量級(jí)且具有魯棒性的基于 Transformer 的語(yǔ)義分割模型。其解碼器由輕量級(jí)的多頭感知層組成。它避免使用大多 Transformer 使用的位置編碼,可在不同分辨率下進(jìn)行高效推理。

使用 NVIDIA L4 GPU

高效驅(qū)動(dòng) Transformer

NVIDIA L4 GPU 是為未來(lái)的視覺 AI 工作負(fù)載而打造的。它們采用 NVIDIA Ada Lovelace 架構(gòu),旨在加速具有變革性的 AI 技術(shù)。

L4 GPU 擁有高達(dá) FP8 485 TFLOPs 的計(jì)算能力,適于運(yùn)行 ViT 工作負(fù)載。相較更高精度的計(jì)算方式,FP8 的低精度計(jì)算可以減輕內(nèi)存壓力,還可以顯著提升 AI 的處理速度。

L4 是一款多功能、節(jié)能高效的設(shè)備,具有單槽、低調(diào)的外形,非常適合用于視覺 AI 部署(包括在邊緣位置)。

您可以觀看Metropolis Developer Meetuphttps://info.nvidia.com/metropolis-meetup-june2023.html),了解有關(guān) ViT、NVIDIA TAO Toolkit 5.0 以及 L4 GPU 的更多信息

點(diǎn)擊“閱讀原文”,或掃描下方海報(bào)二維碼,在 8 月 8日聆聽NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 SIGGRAPH 現(xiàn)場(chǎng)發(fā)表的 NVIDIA 主題演講,了解 NVIDIA 的新技術(shù),包括屢獲殊榮的研究,OpenUSD 開發(fā),以及最新的 AI 內(nèi)容創(chuàng)作解決方案。


原文標(biāo)題:使用 Vision Transformer 和 NVIDIA TAO,提高視覺 AI 應(yīng)用的準(zhǔn)確性和魯棒性

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3780

    瀏覽量

    91185

原文標(biāo)題:使用 Vision Transformer 和 NVIDIA TAO,提高視覺 AI 應(yīng)用的準(zhǔn)確性和魯棒性

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    自動(dòng)駕駛中常提的是個(gè)啥?

    隨著自動(dòng)駕駛技術(shù)的快速發(fā)展,(Robustness)成為評(píng)價(jià)自動(dòng)駕駛系統(tǒng)的重要指標(biāo)之一。很多小伙伴也會(huì)在自動(dòng)駕駛相關(guān)的介紹中,對(duì)某些功能用
    的頭像 發(fā)表于 01-02 16:32 ?410次閱讀
    自動(dòng)駕駛中常提的<b class='flag-5'>魯</b><b class='flag-5'>棒</b><b class='flag-5'>性</b>是個(gè)啥?

    如何提高OTDR測(cè)試的準(zhǔn)確性

    OTDR(光時(shí)域反射儀)是光纜線路故障定位和光纖特性測(cè)量的重要工具,提高OTDR測(cè)試的準(zhǔn)確性對(duì)于確保光纜線路的穩(wěn)定運(yùn)行至關(guān)重要。以下是一些提高OTDR測(cè)試準(zhǔn)確性的方法: 一、
    的頭像 發(fā)表于 12-31 09:25 ?163次閱讀

    如何提高電位測(cè)量準(zhǔn)確性

    在電子工程和物理實(shí)驗(yàn)中,電位測(cè)量是一項(xiàng)基本而重要的任務(wù)。電位測(cè)量的準(zhǔn)確性直接影響到實(shí)驗(yàn)結(jié)果的可靠和產(chǎn)品的安全。 1. 選擇合適的測(cè)量設(shè)備 選擇合適的測(cè)量設(shè)備是提高電位測(cè)量
    的頭像 發(fā)表于 12-28 13:56 ?116次閱讀

    如何提升ASR模型的準(zhǔn)確性

    提升ASR(Automatic Speech Recognition,自動(dòng)語(yǔ)音識(shí)別)模型的準(zhǔn)確性是語(yǔ)音識(shí)別技術(shù)領(lǐng)域的核心挑戰(zhàn)之一。以下是一些提升ASR模型準(zhǔn)確性的關(guān)鍵方法: 一、優(yōu)化數(shù)據(jù)收集與處理
    的頭像 發(fā)表于 11-18 15:14 ?929次閱讀

    原理在控制系統(tǒng)中的應(yīng)用

    在現(xiàn)代控制系統(tǒng)的設(shè)計(jì)和分析中,是一個(gè)核心概念。指的是系統(tǒng)在面對(duì)模型不確定性、外部干擾
    的頭像 發(fā)表于 11-11 10:26 ?1223次閱讀

    深度學(xué)習(xí)模型的優(yōu)化

    深度學(xué)習(xí)模型的優(yōu)化是一個(gè)復(fù)雜但至關(guān)重要的任務(wù),它涉及多個(gè)方面的技術(shù)和策略。以下是一些關(guān)鍵的優(yōu)化方法: 一、數(shù)據(jù)預(yù)處理與增強(qiáng) 數(shù)據(jù)清洗 :去除數(shù)據(jù)中的噪聲和異常值,這是提高模型
    的頭像 發(fā)表于 11-11 10:25 ?280次閱讀

    算法在數(shù)據(jù)處理中的應(yīng)用

    一、算法的基本概念 算法是指在面對(duì)數(shù)據(jù)中的異常值、噪聲和不確定性時(shí),仍能保持穩(wěn)定性能
    的頭像 發(fā)表于 11-11 10:22 ?362次閱讀

    分析方法及其應(yīng)用

    (Robustness)是指系統(tǒng)或方法對(duì)于外部干擾、誤差或變化的穩(wěn)定性和適應(yīng)能力。以下是對(duì)
    的頭像 發(fā)表于 11-11 10:21 ?1469次閱讀

    在機(jī)器學(xué)習(xí)中的重要

    在機(jī)器學(xué)習(xí)領(lǐng)域,模型的是指模型在面對(duì)輸入數(shù)據(jù)的擾動(dòng)、異常值、噪聲或?qū)剐怨魰r(shí),仍能保持性能的能力。隨著人工智能技術(shù)的快速發(fā)展,機(jī)器學(xué)習(xí)模型被廣泛應(yīng)用于各個(gè)領(lǐng)域,從自動(dòng)駕駛汽車到醫(yī)療診斷,再到
    的頭像 發(fā)表于 11-11 10:19 ?395次閱讀

    如何提高系統(tǒng)的

    在當(dāng)今的技術(shù)環(huán)境中,系統(tǒng)面臨著各種挑戰(zhàn),包括硬件故障、軟件缺陷、網(wǎng)絡(luò)攻擊和人為錯(cuò)誤。是指系統(tǒng)在面對(duì)這些挑戰(zhàn)時(shí)保持正常運(yùn)行的能力。 一、定義
    的頭像 發(fā)表于 11-11 10:17 ?698次閱讀

    如何評(píng)估 ChatGPT 輸出內(nèi)容的準(zhǔn)確性

    評(píng)估 ChatGPT 輸出內(nèi)容的準(zhǔn)確性是一個(gè)復(fù)雜的過(guò)程,因?yàn)樗婕暗蕉鄠€(gè)因素,包括但不限于數(shù)據(jù)的質(zhì)量和多樣、模型的訓(xùn)練、上下文的理解、以及輸出內(nèi)容的邏輯一致。以下是一些評(píng)估 ChatGPT 輸出
    的頭像 發(fā)表于 10-25 17:48 ?593次閱讀

    如何保證測(cè)長(zhǎng)機(jī)測(cè)量的準(zhǔn)確性

    可以通過(guò)以下方法保證測(cè)長(zhǎng)機(jī)測(cè)量的準(zhǔn)確性:一、設(shè)備方面1.定期校準(zhǔn)按照規(guī)定的時(shí)間間隔,將測(cè)長(zhǎng)機(jī)送往專業(yè)的計(jì)量機(jī)構(gòu)或使用標(biāo)準(zhǔn)器進(jìn)行校準(zhǔn)。校準(zhǔn)可以確定測(cè)長(zhǎng)機(jī)的測(cè)量誤差,并對(duì)其進(jìn)行調(diào)整,確保測(cè)量結(jié)果的準(zhǔn)確性
    的頭像 發(fā)表于 10-25 16:16 ?343次閱讀
    如何保證測(cè)長(zhǎng)機(jī)測(cè)量的<b class='flag-5'>準(zhǔn)確性</b>?

    傾斜光柵的優(yōu)化

    摘要 ** 由于制造過(guò)程中潛在的不準(zhǔn)確性,對(duì)于一個(gè)好的光柵設(shè)計(jì)來(lái)說(shuō),面對(duì)光柵參數(shù)的微小變化,提供穩(wěn)健的結(jié)果是至關(guān)重要的。VirtualLab Fusion為光學(xué)工程師提供了各種工具,可以將這種行為
    發(fā)表于 08-12 18:38

    影響電源紋波測(cè)試準(zhǔn)確性的因素

    電源紋波測(cè)試是評(píng)估電源質(zhì)量的重要手段之一,它能夠反映出電源在輸出電壓中的波動(dòng)情況。然而,測(cè)試過(guò)程中的多種因素都可能對(duì)測(cè)試結(jié)果的準(zhǔn)確性產(chǎn)生影響。本文將從多個(gè)方面分析影響電源紋波測(cè)試準(zhǔn)確性的因素,并提
    的頭像 發(fā)表于 08-02 09:42 ?627次閱讀

    電流探頭測(cè)試小技巧:提高準(zhǔn)確性和安全

    電流探頭是一種常用的測(cè)試工具,用于測(cè)量電路中的電流。正確使用電流探頭可以提高測(cè)試的準(zhǔn)確性,并確保操作的安全。本文將介紹一些電流探頭的測(cè)試小技巧,幫助您更好地使用電流探頭進(jìn)行電流測(cè)量。 技巧一:正確
    的頭像 發(fā)表于 03-08 09:31 ?380次閱讀
    電流探頭測(cè)試小技巧:<b class='flag-5'>提高</b><b class='flag-5'>準(zhǔn)確性</b>和安全<b class='flag-5'>性</b>
    主站蜘蛛池模板: 爽爽窝窝午夜精品一区二区| 亚洲欧美综合乱码精品成人网| 免费看美女的网站| 男女边吃奶边做边爱视频| 欧美精品XXXXBBBB| 日韩一本在线| 忘忧草直播| 亚洲麻豆精品成人A在线观看| 一本二卡三卡四卡乱码麻豆| 6080伦理久久亚洲精品| WWW婷婷AV久久久影片| 国产传媒在线播放| 精品国产免费第一区二区| 麻豆AV福利AV久久AV| 日本阿v直播在线| 亚洲AV精品无码国产一区| 孕妇泬出白浆18P| 阿片在线播放| 国产亚洲精品久久久久5区| 久久是热频国产在线| 青青草在现线免费观看| 小小水蜜桃免费影院| 在线观看永久免费网址| xfplay 无码专区 亚洲| 国产香蕉视频| 墨西哥美女主播| 无码人妻精品一区二区蜜桃色| 一区二区三区四区国产| xxnx动漫| 黄色aa大片| 人人看人人看| 野花日本手机观看大全免费3| 99热在线播放| 国产午夜精品片一区二区三区| 老女老肥熟国产在线视频| 神马电影我不卡4k手机在线观看| 亚洲在线视频自拍精品| 成年美女黄网站色app| 久草高清在线| 色婷婷国产精品视频一区二区三区 | 亚洲中文字幕无码一去台湾|