北京智源大會是北京智源研究院主辦的年度國際性人工智能高端學術交流活動。自 2019 年 10 月首次召開至今,有 8 位圖靈獎得主曾參與大會,每年有 200 位頂尖專家出席,來自 30 多個國家和地區的觀眾齊聚一堂。
今年的大會將于 6 月 9 日至 10 日在北京市海淀區中關村國家自主創新示范區展示中心召開,預計將有超過 3 萬名 AI 領域的專業人士在線上或線下參會,分享研究成果,學習前沿知識,交換實踐經驗,建立聯系合作。
大語言模型和生成式 AI 代表了一個新的技術范式,推動著 AI 技術與各行各業的深度融合。
對于 3D 內容創作領域,如何提升數字內容生產力和生成效率,也成為其在大語言模型和生成式 AI 時代亟需思考的問題。
近幾年,NVIDIA 推出了一系列全棧式解決方案,以助力滿足大語言模型和生成式 AI 爆發式發展下的迅猛需求。在 3D 創作領域,從可逆渲染流程 NVIDIA 3D MoMa,到被美國《時代》周刊評為 2022 年度最佳發明的 NVIDIA Instant NeRF,以及近期在 CVPR 2023 發布的 NVIDIA Neuralangelo,NVIDIA Research 在 3D 視覺領域發布的一系列研究成果也受到廣泛關注。
對于 3D 內容創作領域,基于這些大語言模型和生成式 AI 方面的研究進展和技術進步,不僅能夠提高設計的速度、準確性、以及建模的效率,創作方式本身也發生了變革。
在明日(6 月 9 日)即將舉辦的北京智源大會上,來自 NVIDIA 的多位專家也受邀參會發表演講,包括 NVIDIA 中國區工程和解決方案高級總監賴俊杰,以及來自 NVIDIA 多倫多 AI 實驗室的三位研究科學家——NVIDIA 高級研究科學家 Karsten Kreis、NVIDIA 研究科學家高俊、NVIDIA 研究科學家 Huan Ling。
NVIDIA 中國區工程和解決方案高級總監賴俊杰將深度解析 NVIDIA GPU 軟硬件結合的技術創新如何推動大模型技術的發展演進,介紹如何基于 NVIDIA Megatron 更高效地構建大語言模型訓練系統,在大模型時代提高模型開發效率和模型質量。
來自 NVIDIA 多倫多 AI實驗室的研究科學家們將帶來兩場精彩的學術分享。隨著許多行業對創建大規模 3D 虛擬世界的需求不斷增加,對多樣化和高質量的 3D 內容有巨大的需求。他們將概述 NVIDIA 最近在機器學習和擴散模型方面的工作及其在圖像、視頻和 3D 內容創建方面的應用,以實現大規模的 3D 內容創作,并將重點介紹在 3D 生成建模方面的不同努力,包括以對象為中心的 3D 合成以及全場景級生成。
AI 系統論壇
基于 NVIDIA Megatron 更高效地
構建大語言模型訓練系統
6 月 10 日上午 1045
暢春廳
大語言模型是當今最重要的先進技術之一,NVIDIA 開發的基于 PyTorch 的訓練框架 - Megatron 與 NeMo Framework 的開創性技術,能夠提高訓練速度且可擴展性強,使得大模型的訓練和部署變得更加容易,具有更短的時間成本和更快的結果。
本議題將深度解析 NVIDIA GPU 軟硬件結合的技術創新如何推動大模型技術的發展演進,NVIDIA Megatron 框架的優化方法,包括其高效的并行策略、內存優化技術等,以及如何利用該框架在大模型時代提高模型開發效率和模型質量。
演講嘉賓
賴俊杰
NVIDIA 中國區工程和解決方案高級總監
賴俊杰主要負責帶領團隊對接中國區核心大客戶的技術需求,以及開發相應的行業解決方案,定制軟件產品等。賴博士本科和碩士就讀于清華大學電子工程系,并于法國國家計算機與自動化研究所獲得博士學位。博士期間的主要研究方向包括 GPU 架構研究,及 GPU 性能分析模型。賴博士專注在高性能計算、并行計算、人工智能及互聯網行業應用,在并行程序的性能分析及性能優化領域有豐富的經驗。
視覺與多模態大模型論壇
機器學習促進 3D 內容創作
6 月 9 日下午 1450
靜宜廳
隨著許多行業對創建大規模 3D 虛擬世界的需求不斷增加,對多樣化和高質量的 3D 內容有巨大的需求。機器學習的存在使這一追求成為可能。本場演講將討論如何從結合可分化等值面和可分化渲染的角度出發,實現大規模的 3D 內容創作,并對現實世界產生影響。
為此,研究中首先介紹了一種基于四面體網格的可微分三維表示法,以實現任意拓撲結構的三維網格的高質量恢復。通過結合可分化的渲染,研究者進一步設計了一個生成模型,能夠產生具有復雜紋理和材料的 3D 形狀,用于網格生成。研究中所用框架為從文本提示中利用二維擴散模型進行創新的高質量三維網格創建鋪平了道路,這使新手的 3D 內容創建更加大眾化。
演講嘉賓
高俊
NVIDIA 研究科學家
高俊是多倫多大學的博士生,由 Sanja Fidler 教授指導。他也是 NVIDIA 多倫多 AI 實驗室的一名研究科學家。他的研究興趣集中在 3D 計算機視覺和計算機圖形的交叉領域,特別是開發機器學習工具,以促進大規模的 3D 內容創作并推動現實世界的應用。他的許多貢獻已經在產品中實現,包括 NVIDIA Picasso、GANVerse3D、Neural DriveSim 和 Toronto Annotation Suite。他將在 2023 年的 NeurIPS 上擔任領域主席。
借助擴散模型進行圖像、視頻
和 3D 內容創作
6 月 9 日下午 15:35 - 16:20
靜宜廳
基于擴散的降噪生成模型激發了深度生成學習的多項突破。本場演講將概述 NVIDIA 最近在擴散模型方面的工作及其在圖像、視頻和 3D 內容創建方面的應用。演講將從對擴散模型的簡短介紹開始,討論大規模文本到圖像的生成,然后重點介紹在 3D 生成建模方面開展的多項工作,包括以對象為中心的 3D 合成以及全場景級生成。最后將討論的是 NVIDIA 最近在使用視頻潛在擴散模型生成高分辨率視頻方面的工作。研究者將最先進的文本到圖像模型 Stable Diffusion 轉變為高分辨率文本到視頻生成器,還演示了真實野外駕駛場景視頻的模擬。
演講嘉賓
Karsten Kreis
NVIDIA 高級研究科學家
Karsten Kreis 是 NVIDIA 多倫多 AI 實驗室的高級研究科學家。在加入 NVIDIA 之前,他在 D-Wave Systems 從事深度生成建模工作,并與他人共同創立了 Variational AI,這是一家利用生成模型進行藥物發現的初創公司。在轉向深度學習之前,他在馬克斯-普朗克光科學研究所獲得了量子信息理論碩士學位,并在馬克斯-普朗克聚合物研究所獲得了計算和統計物理學博士學位。目前,Karsten 的研究重點是開發新的生成學習方法,主要是擴散模型,以及將深度生成模型應用于計算機視覺、圖形和數字藝術以及自然科學等領域的問題。
Huan Ling
NVIDIA 研究科學家
Huan Ling 是 NVIDIA 多倫多人工智能實驗室的研究科學家,他是多倫多大學 Sanja Fidler 教授的博士生,還是 Vector Institute 的研究員。他的研究重點是大規模生成模型以及將生成模型用于計算機視覺感知任務。他在 NVIDIA 的研究工作包括 DatasetGAN、EditGAN 和 Align your Latents: VideoLDM。
點擊“閱讀原文”即可報名現場參加各專題論壇或預約線上直播,快來參會吧!
掃描下方海報二維碼,觀看 NVIDIA 創始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放,主題演講中文字幕版已上線,了解 AI、圖形及其他領域的最新進展!
原文標題:智源大會 | NVIDIA 科學家深度解析大語言模型訓練和 3D 內容創作最新成果
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3796瀏覽量
91320
原文標題:智源大會 | NVIDIA 科學家深度解析大語言模型訓練和 3D 內容創作最新成果
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論