完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > cuda
文章:97個(gè) 瀏覽:13641次 帖子:19個(gè)
使用新的Nsight Compute改進(jìn)導(dǎo)航和性能可視化
源頁(yè)面上的度量分組和選擇選項(xiàng)有改進(jìn),使其更易于使用。此外,此版本還增加了對(duì)在基于 ARM SBSA 和 L4T 的平臺(tái)上運(yùn)行 Nsight Comp...
NVIDIA CUDA 工具包提供了開(kāi)發(fā)環(huán)境,可供開(kāi)發(fā)、優(yōu)化和部署經(jīng) GPU 加速的高性能應(yīng)用。
一種將CUDA代碼遷移到SYCL和C++的開(kāi)源工具
英特爾發(fā)布了一項(xiàng)開(kāi)源工具,該工具可通過(guò)名為SYCLomatic的項(xiàng)目,將代碼遷移至SYCL1,這有助于開(kāi)發(fā)者更輕松地將CUDA代碼遷移到SYCL和C++...
NVIDIA TensorRT加速打造實(shí)時(shí)數(shù)字化運(yùn)動(dòng)場(chǎng)景
我們的硬件方案也從 4 臺(tái) HPC 縮減到 1 臺(tái) HPC 搭載 2 張 A100 GPU,不僅顯著地降低了成本,也顯著降低了系統(tǒng)維護(hù)和使用的復(fù)雜度...
TensorRT創(chuàng)建層時(shí)序緩存以保存層分析信息
為了減少構(gòu)建器時(shí)間,TensorRT 創(chuàng)建了一個(gè)層時(shí)序緩存,以在構(gòu)建器階段保存層分析信息。它包含的信息特定于目標(biāo)構(gòu)建器設(shè)備、CUDA 和 TensorR...
TensorRT builder 使用時(shí)間來(lái)找到最快的內(nèi)核來(lái)實(shí)現(xiàn)給定的運(yùn)算符。時(shí)序內(nèi)核會(huì)受到噪聲的影響——GPU 上運(yùn)行的其他工作、GPU 時(shí)鐘速度...
在 CUDA 上下文中,內(nèi)核作為 PTX 或二進(jìn)制對(duì)象由主機(jī)代碼顯式加載,如模塊中所述。 因此,用 C++ 編寫(xiě)的內(nèi)核必須單獨(dú)編譯成 PTX 或二進(jìn)制對(duì)...
2022-05-07 標(biāo)簽:API應(yīng)用程序CUDA 1770 0
為了最好地確保 RPM 和 Debian 軟件包存儲(chǔ)庫(kù)的安全性和可靠性, NVIDIA 從 2022 年 4 月 27 日開(kāi)始更新并輪換apt、dn...
如何使用DPDK和GPUdev增強(qiáng)內(nèi)聯(lián)數(shù)據(jù)包處理
對(duì)于特定于 NVIDIA 的 GPU , GPUdev 庫(kù)功能通過(guò) CUDA 驅(qū)動(dòng)程序 DPDK 庫(kù) 。要為 NVIDIA GPU 啟用所有g(shù)pud...
新 Volta GPU 架構(gòu)的一個(gè)定義性特征是它的 張量核 ,它使 Tesla V100 加速器的峰值吞吐量是上一代 Tesla P100 的 32...
2022-04-28 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)人工智能CUDA 2139 0
我們使用了 NVIDIA 的 CUDA 庫(kù) 直接在 NVIDIA GPUs 上運(yùn)行應(yīng)用程序并執(zhí)行批處理。下面的代碼片段使用 CUDA 執(zhí)行矩陣乘法。
2022-04-28 標(biāo)簽:gpuCUDA深度學(xué)習(xí) 2339 0
允許圖創(chuàng)建和擁有內(nèi)存分配功能的圖內(nèi)存節(jié)點(diǎn)
CUDA 可以重用相同的物理內(nèi)存進(jìn)行跨多個(gè)圖的分配,根據(jù) GPU 有序生命周期語(yǔ)義對(duì)虛擬地址映射進(jìn)行別名化。例如,當(dāng)不同的
用戶可以通過(guò)使用設(shè)備屬性 cudaDevAttrMemoryPoolsSupported 調(diào)用 cudaDeviceGetAttribute() 來(lái)...
支持動(dòng)態(tài)并行的CUDA擴(kuò)展功能和最佳應(yīng)用實(shí)踐
本文檔描述了支持動(dòng)態(tài)并行的 CUDA 的擴(kuò)展功能,包括為利用這些功能而對(duì) CUDA 編程模型進(jìn)行必要的修改和添加,以及利用此附加功能的指南和最佳實(shí)踐。
虛擬內(nèi)存管理API提供管理統(tǒng)一虛擬地址空間的方法
在通過(guò) cudaEnablePeerAccess 啟用對(duì)等設(shè)備訪問(wèn)內(nèi)存分配的情況下,所有過(guò)去和未來(lái)的用戶分配都映射到目標(biāo)對(duì)等設(shè)備。這導(dǎo)致用戶無(wú)意中支...
使用模塊化流簡(jiǎn)化RHEL 8上的NVIDIA驅(qū)動(dòng)程序部署
NVIDIA GPUs 已成為加速機(jī)器學(xué)習(xí)、高性能計(jì)算( HPC )、內(nèi)容創(chuàng)建工作流和數(shù)據(jù)中心應(yīng)用程序等多種工作負(fù)載的主流。對(duì)于這些企業(yè)用例, NV...
如上所述,操作員狀態(tài)機(jī)包括驗(yàn)證步驟,以確保組件已成功啟動(dòng)。操作員調(diào)度一個(gè)簡(jiǎn)單的 CUDA 工作負(fù)載(在本例中是一個(gè) vectorAdd 示例)。如果...
CUDA和NVIDIA Ampere微體系結(jié)構(gòu)GPUs
A100 是第一款 GPU 可以通過(guò) NVLink 擴(kuò)展到完整的 GPU ,也可以通過(guò)降低每個(gè) GPU 實(shí)例的成本,使用 MIG 擴(kuò)展到許多用戶。 ...
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語(yǔ)言教程專題
電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動(dòng)駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無(wú)刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺(jué) | 無(wú)人機(jī) | 三菱電機(jī) | ST |
伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國(guó)民技術(shù) | Microchip |
Arduino | BeagleBone | 樹(shù)莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |