在全球 AI 產業生態體系日趨成熟的背景下,加速計算迎來了前所未有的發展空間,在眾多不同應用以及各行各業得到了廣泛應用,相關技術也飛速發展不斷迭代。
10 月 22 日,在 NVIDIA AI 研發技術開放日上,共邀請了 10 位來自 NVIDIA 加速計算專家團隊的講師,深入互聯網核心應用場景,聚焦五大技術熱點,與大家分享了加速計算的優化經驗。
演講視頻已正式上線
歡迎掃描下方二維碼,觀看精彩內容:
演講一
– 最佳實踐分享
演講嘉賓:NVIDIA 加速計算專家 劉冰 & 鄭鵬
演講簡介:
演講二
在NVIDIA NeMo 中實現
大語言模型全周期開發
– 以 LLaMa2 為例
演講嘉賓:NVIDIA 加速計算專家 姚鑫 & 顏子杰
演講簡介:
-
NeMo Framework 介紹
-
使用 Nemo Framework 進行預訓練,包括優化策略和性能
-
微調:包括 SFT 和 PEFT
-
RLHF:包括 RLHF 的訓練與性能優化算法
-
介紹如何將模型導出到 TensorRT-LLM
演講三
TensorRT Hackathon 2023
總結AIGC 及大語言模型推理
的典型案例深入解析
演講嘉賓:NVIDIA 加速計算專家 季光 & 陳庾
演講簡介:
-
TensorRT Hackathon 2023 總結:TensorRT Hackathon 是 NVIDIA 組織的年度編程賽事。我們回顧今年的賽事情況,包括賽題、比賽的組織與結果,并歡迎更多開發者參加比賽。
-
通過 TensorRT-LLM 中的量化技術加速 LLM 推理
演講四
向量數據庫的加速策略和實戰
演講嘉賓:NVIDIA 加速計算專家 王雍 & 張靜蓉
演講簡介:
-
介紹 Vector DB 的核心引擎近似最近鄰(ANN)搜索
-
RAPIDS-RAFT 庫中基于 GPU 的 ANN 并行算法和工具,包括:IVF-Flat、IVF-PQ、基于圖的方法等
-
ANN 算法中使用的關鍵優化技術,特別是并行 Top-K 算法
演講五
和實踐– 以 HPS 為例
演講嘉賓:NVIDIA 加速計算專家 魏英燦 & 王澤寰
演講簡介:
-
用于推薦系統推理加速的分級參數服務器(HPS)框架介紹
-
高性能 GPU 推理緩存的設計思路與實現細節
-
HPS 與 GPU 推理緩存的性能評估
GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會議中心舉行,線上大會也將同期開放。點擊“閱讀原文”或掃描下方海報二維碼,立即注冊 GTC 大會。
原文標題:精彩回顧| “NVIDIA AI 研發技術開放日” 演講視頻全集!
文章出處:【微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3771瀏覽量
91003
原文標題:精彩回顧| “NVIDIA AI 研發技術開放日” 演講視頻全集!
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論