色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA TensorRT的數據格式定義

星星科技指導員 ? 來源:NVIDIA ? 作者:Ken He ? 2022-05-20 14:48 ? 次閱讀

TensorRT 支持不同的數據格式。有兩個方面需要考慮:數據類型和布局。

數據類型格式

數據類型是每個單獨值的表示。它的大小決定了取值范圍和表示的精度,分別是FP32(32位浮點,或單精度),FP16(16位浮點或半精度),INT32(32位整數表示),和 INT8(8 位表示)。

布局格式

布局格式確定存儲值的順序。通常,batch 維度是最左邊的維度,其他維度指的是每個數據項的方面,例如圖像中的C是通道, H是高度, W是寬度。忽略總是在這些之前的批量大小, C 、 H和W通常被排序為CHW (參見圖 1 )或HWC (參見圖 2 )。

圖1. CHW的布局格式:圖像分為HxW矩陣,每個通道一個,矩陣按順序存儲;通道的所有值都是連續存儲的。

poYBAGKHOmuAG3jrAABI1Auz45s159.png

圖2. HWC的布局格式:圖像存儲為單個HxW矩陣,其值實際上是 C 元組,每個通道都有一個值;一個點(像素)的所有值都是連續存儲的。

pYYBAGKHOmSAF4_4AABE_ZAr4MY310.png

為了實現更快的計算,定義了更多格式以將通道值打包在一起并使用降低的精度。因此,TensorRT 還支持NC / 2HW2和NHWC8等格式。

在NC / 2HW2 ( TensorFormat::kCHW2 ) 中,通道值對在每個HxW矩陣中打包在一起(在奇數通道的情況下為空值)。結果是一種格式,其中? C/2 ? HxW矩陣的值是兩個連續通道的值對(參見圖 3 );請注意,如果它們在同一對中,則此排序將維度交錯為具有步長1的通道的值,否則將步長為 2xHxW 。

圖 3. 一對通道值在每個HxW矩陣中打包在一起。結果是一種格式,其中[C/2] HxW矩陣的值是兩個連續通道的值對

poYBAGKHOl6AAMv6AABJ1rtP6Z8262.png

在NHWC8 ( TensorFormat::kHWC8 ) 中, HxW矩陣的條目包括所有通道的值。此外,這些值被打包在? C/8 ? 8 元組中,并且C向上舍入到最接近的 8 倍數。

在這種NHWC8格式中, HxW矩陣的條目包括所有通道的值。

其他TensorFormat遵循與前面提到的TensorFormat::kCHW2和TensorFormat::kHWC8類似的規則。

關于作者

Ken He 是 NVIDIA 企業級開發者社區經理 & 高級講師,擁有多年的 GPU人工智能開發經驗。自 2017 年加入 NVIDIA 開發者社區以來,完成過上百場培訓,幫助上萬個開發者了解人工智能和 GPU 編程開發。在計算機視覺,高性能計算領域完成過多個獨立項目。并且,在機器人無人機領域,有過豐富的研發經驗。對于圖像識別,目標的檢測與跟蹤完成過多種解決方案。曾經參與 GPU 版氣象模式GRAPES,是其主要研發者。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28466

    瀏覽量

    207294
  • NVIDIA
    +關注

    關注

    14

    文章

    4994

    瀏覽量

    103153
  • 人工智能
    +關注

    關注

    1791

    文章

    47350

    瀏覽量

    238739
收藏 人收藏

    評論

    相關推薦

    NVIDIA TensorRT-LLM中啟用ReDrafter的一些變化

    Recurrent Drafting (簡稱 ReDrafter) 是蘋果公司為大語言模型 (LLM) 推理開發并開源的一種新型推測解碼技術,該技術現在可與 NVIDIA TensorRT-LLM 一起使用。
    的頭像 發表于 12-25 17:31 ?156次閱讀
    在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT</b>-LLM中啟用ReDrafter的一些變化

    解鎖NVIDIA TensorRT-LLM的卓越性能

    NVIDIA TensorRT-LLM 是一個專為優化大語言模型 (LLM) 推理而設計的庫。它提供了多種先進的優化技術,包括自定義 Attention Kernel、Inflight
    的頭像 發表于 12-17 17:47 ?179次閱讀

    NVIDIA TensorRT-LLM Roadmap現已在GitHub上公開發布

    感謝眾多用戶及合作伙伴一直以來對NVIDIA TensorRT-LLM的支持。TensorRT-LLM 的 Roadmap 現已在 GitHub 上公開發布!
    的頭像 發表于 11-28 10:43 ?288次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT</b>-LLM Roadmap現已在GitHub上公開發布

    FP8數據格式在大型模型訓練中的應用

    本文主要介紹了 FP8 數據格式在大型模型訓練中的應用、挑戰及最佳實踐,展示了 FP8 在提升訓練速度和效率方面的潛力和實際效果。
    的頭像 發表于 11-19 14:54 ?335次閱讀
    FP8<b class='flag-5'>數據格式</b>在大型模型訓練中的應用

    ADC3561轉換成什么數據格式便于高速實時通過WIFI發送?

    5MHz的16位采樣率,LVDS格式數據輸出,使用串口轉WIFI模塊受限于串口波特率無法實現實時發送,請問轉換成什么數據格式便于高速實時通過WIFI發送
    發表于 11-18 08:06

    PCM2707的S/PDIF輸出的數據格式是什么?

    我想問一下PCM2707的S/PDIF輸出的數據格式是什么? 在網上查到的資料說是S/PDIF是用來傳輸數字信號的,可以傳輸PCM形式的信號,那是不是就是說帶有S/PDIF輸出的聲卡(比如說
    發表于 11-07 06:33

    請問AIC3106怎么設置成單聲道32位數據格式

    AIC3106 怎樣設置成單聲道 32位數據格式
    發表于 11-04 08:17

    SRC4192能否支持輸入TDM格式音頻數據,輸出I2S,進行數據格式轉換?

    SRC4192這款芯片能否支持輸入TDM格式音頻數據,輸出I2S,進行數據格式轉換。在我看TI這款芯片的datasheet時候管腳描述如下: 我理解是可以TDM輸入的,可是后面關于輸入輸出
    發表于 10-25 11:41

    請問TLV320AIC3268的ADC轉換后的數據格式是什么樣的?

    我在使用TLV320AIC3268,但是不知道ADC轉換后的數據格式是什么樣的?比如是二進制補碼嗎?轉后的數據與輸入的模擬信號的電壓值有什么關系?
    發表于 10-14 07:48

    NVIDIA Nemotron-4 340B模型幫助開發者生成合成訓練數據

    Nemotron-4 340B 是針對 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 優化的模型系列,該系列包含最先進的指導和獎勵模型,以及一個用于生成式 AI 訓練的
    的頭像 發表于 09-06 14:59 ?327次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron-4 340B模型幫助開發者生成合成訓練<b class='flag-5'>數據</b>

    KIT_ATV_24GHZ_RADAR是否可以從網口讀取雷達的原始回波數據數據格式是怎樣的?

    請問有沒有這款開發板的調試手冊,是否可以從網口讀取雷達的原始回波數據數據格式是怎樣的?
    發表于 07-24 06:10

    態勢數據有哪些格式

    智慧華盛恒輝態勢數據格式可以因應用場景和數據來源的不同而有所差異。以下是一些常見的態勢數據格式,并進行了分點表示和歸納: 智慧華盛恒輝態勢數據
    的頭像 發表于 06-24 17:44 ?322次閱讀

    態勢數據有哪些格式和內容呢

    智慧華盛恒輝態勢數據格式和內容可以根據其應用領域和具體需求而有所不同。以下是關于態勢數據格式和內容的清晰歸納: 智慧華盛恒輝數據格式 XML:
    的頭像 發表于 06-11 16:57 ?519次閱讀

    請問CAN數據域的數據格式該如何定義?以什么標準定義

    最近需要實現上位機與下位機的CAN通訊,現在雙方苦于不知該如何定義數據格式,尤其是傳輸浮點數據~~ 起初經過討論直接根據個人主觀意愿定義了雙方的數據
    發表于 05-09 07:20

    請問TouchGFX支不支持rgb-16bit數據格式

    請教下,TouchGFX 支不支持 rgb-16bit 數據格式
    發表于 04-23 06:05
    主站蜘蛛池模板: 男人插曲女人的视频| 久久是热频国产在线| 中文字幕日本久久2019| 亚洲精品久久久久久偷窥| 歪歪漫画羞羞漫画国产| 日本乱子伦一区二区三区| 欧美日韩看看2015永久免费| 美国色情三级欧美三级纸匠情挑| 韩日午夜在线资源一区二区| 国产色青青视频在线观看| 国产精品亚洲专一区二区三区| 国产成人a v在线影院| 国产GV无码A片在线观看| 岛国精品在线观看| 二级片免费看| 国产精品久久久久久久久久久 | 2020年国产精品午夜福利在线观看| 一区二区不卡在线视频| 再插深点嗯好大好爽| 中文字幕午夜乱理片| 538在线播放| av天堂影音先锋在线| 超碰免费视频公开97| 国产成人拍精品免费视频爱情岛 | 美女网站免费看| 欧美video巨大粗暴18| 青青青青草| 忘忧草在线社区WWW日本-韩国| 小黄文纯肉污到你湿| 亚洲欭美日韩颜射在线二| 最近2019年日本中文免费字幕 | 女人和男人插曲视频大全| 秋霞电影院兔费理论84MB| 色色色999| 亚洲精品高清AV在线播放| 夜色55夜色66亚洲精品网站| 91夫妻交友论坛| 高清观看ZSHH96的视频素材| 国产午夜亚洲精品区| 久久久97人妻无码精品蜜桃| 免费人成网站在线观看10分钟|