AI 賦能萬物的時代已經到來。5 月 28 日,GOTC 2023 "AIis Everywhere專題論壇 " 由 Linux 基金會亞太區副總裁楊軒擔任出品人,將于上海張江科學會堂召開。
全球開源技術峰會(Global Open-source Technology Conference,簡稱 GOTC)是由開放原子開源基金會、 Linux 基金會亞太區、上海浦東軟件園和開源中國聯合發起的,面向全球開發者的一場盛大開源技術盛宴。
GOTC 2023 為期兩天,大會將以行業展覽、主題發言、特別論壇、分論壇的形式展現,與會者將一起探討元宇宙、3D 與游戲、eBPF、Web3.0、區塊鏈等熱門技術主題,以及開源社區、AIGC、汽車軟件、AI 編程、開源教育培訓、云原生等熱門話題,探討開源未來,助力開源發展。
AI 已經顛覆世界,GOTC 2023報名通道現已開啟,來吧,一起走進AIis Everywhere專題論壇,探討開源 AI 的未來。
大會亮點:
AI與數據、數據庫的未來
訓練框架、推理模型、算法量產
詳解PyTorch 2.0體系結構
大模型與多模態技術、AI應用落地實踐
出品人:楊軒
現為 Linux 基金會亞太區副總裁,擁有超過 20 年軟件行業經驗,曾在 Saba、Sumtotal、Computer Associates 等大型國際軟件公司擔任高級管理職務。擁有豐富的企業級軟件應用和開發經驗,以及軟件開源和數字化轉型實踐經驗。
議題:Welcome and Introduction
演講時間:9:00-9:20
演講嘉賓:譚中意 | LF AI Outreach 主席
議題:Keynote
演講時間:9:20-9:40
演講嘉賓:Ibrahim Haddad | LF AI & Data 基金會執行董事、PyTorch 基金會執行董事
議題:AI & Data: painpoints and the future.
演講時間:9:40-10:00
演講嘉賓:堵俊平 | LF AI & Data Board Chair、ASF Member
議題簡介:當下,由 ChatGPT 引爆的大語言模型革命正在產生深遠影響。作為智能時代最稀缺的資源之一,數據的重要性毋庸置疑,也經常成為各大企業與研究機構模型研發與調優的瓶頸。本議題重點討論大模型背后的數據痛點以及面向未來的應對方案。
議題:大規模語言模型在智能文檔問答的應用:基于Langchain和Langchain-serve的解決方案
演講時間:10:00-10:20
演講嘉賓:王楠 | Jina AI 聯合創始人兼 CTO
議題簡介:文檔問答系統的任務是從文檔數據中查找與用戶問題相關的答案。由于文檔數量不斷增加,傳統的搜索已經不能滿足人們的需求。隨著深度學習模型的發展,文檔問答系統從基于字符匹配的方法遷移到基于向量表示的方法。但是,它們仍然只能返回與問題相關的段落,不能直接給出問題的答案,尤其是對于是否類問題。最近,大規模語言模型的能力不斷提升,為文檔問答系統的答案生成問題提供了解決方案。新一代的文檔問答系統將傳統模型、深度學習問答模型和大規模語言模型技術融合在一起,為用戶提供更完善的文檔問答服務。本次演講將介紹如何使用 Langchain 開發框架和 Langchain-serve 部署工具來開發智能文檔問答系統。
議題:昇思大模型一站式易用實踐
演講時間:10:20-10:40
演講嘉賓:何蘆微 | 華為資深開源工程師
議題簡介:人工智能發展到今天,已經從” 大煉模型 “逐步邁向” 煉大模型 “。相比傳統針對特定應用場景需求進行訓練的模型,大模型泛化能力強,不再局限于單一特定場景,也因此它需要更大更廣數據量的” 投喂 “,需要更強的算力訓練,這些都需要巨量的成本,絕大部分開發者基本無法承擔,如何降低大模型的訓練和應用門檻成了新的難題。 在本次議題中,我們將帶來昇思大模型一站式易用實踐分享,介紹昇思 MindSpore 社區打造的一站式大模型平臺,它集模型選型、在線推理、在線訓練為一體,支持大模型的在線體驗及微調,讓開發者零距離接觸紫東?太初以文生文,悟空畫畫以文生圖,Luojia 遙感檢測等大模型應用。
議題:AI數據庫OpenMLDB應用實踐
演講時間:10:40-11:00
演講嘉賓:陳迪豪 | 第四范式架構師
議題簡介:AI 已經成為計算機基礎架構中不可或缺的一環,而針對 AI 場景優化的數據庫也應運而生。AI 數據庫不僅功能上要滿足特征工程以及機器學習模型的上線需求,在離線和在線性能上也有更高的要求。本次分享將以 OpenMLDB 項目為例,深入介紹 AI 數據庫的應用場景和性能優化,實現特定 AI 場景快速落地以及數倍甚至數十倍的性能提升。
議題:向量數據庫:面向AIGC的海量記憶體
演講時間:11:00-11:20
演講嘉賓:郭人通 | Zilliz 合伙人、產品總監
議題簡介:在 AIGC 大火的時代,向量數據庫在海量非結構化數據處理中發揮著越來越重要的作用,本次分享將重點介紹在 AIGC 浪潮里,向量數據庫如何為 AI 賦能。
議題:PyTorch 2.0:將編譯器技術引入PyTorch內核
演講時間:11:20-11:55
演講嘉賓:Peng Wu | Engineering Manager supporting the PyTorch compiler team
議題簡介:PyTorch 2.0 利用編譯器實現更快的訓練和推理,同時不犧牲 PyTorch 的靈活性和易用性。本次演講將概述新 torch.compile () API 背后的技術棧,并討論 PyTorch 2.0 的關鍵特性,包括其完全向后兼容以及模型訓練速度提高 43%。我們將介紹各種堆棧組件,如 TorchDynamo、AOTAutograd、PrimTorch 和 TorchInductor,以及它們如何協同工作以簡化模型開發過程。參會者將更深入地了解 PyTorch 2.0 架構以及在深度學習框架中整合編譯器技術所帶來的優勢。
議題:開源深度學習框架飛槳及其開源社區
演講時間:13:30-14:00
演講嘉賓:張軍 | 百度飛槳框架產品負責人、開放原子開源基金會 TOC 委員
議題簡介:本報告結合生成式 AI 的最新發展趨勢和百度的實踐,介紹百度深度學習平臺 + 大模型核心技術研發、產品創新和生態建設的進展。報告同時分享圍繞飛槳產業級深度學習開源開放平臺、在新趨勢下開展產教融合教育生態建設的思考。
議題:當聯邦學習遇到大型語言模型
演講時間:14:00-14:20
演講嘉賓:彭麟 | VMware CTO 辦公室資深研究員
議題簡介:聯邦學習使得多個數據源可以在不共享數據的情況下協同訓練一個模型。近年來,基于 transformer 的大型語言模型越來越受歡迎。然而,這些模型由于其高計算資源需求和復雜算法而帶來挑戰。在本次演講中,我們將介紹 FATE 在金融用例中將聯邦學習應用于 GPT-J、ChatGLM-6B、GLM 和 LLaMA 等大型語言模型方面的最新努力。FATE 將聯邦學習的分布式訓練機制與大規模模型相結合,在保持各方敏感數據僅限于本地域內的同時允許根據每個參與者實際數據量進行計算投入。這使得能夠共同培訓大規模模式并互惠互利。我們還將探討技術和實踐考慮因素、現實世界用例以及對隱私保護機制的需求。
議題:模型推理優化,探索AI落地潛能
演講時間:14:20-14:40
演講嘉賓:袁麗雅 | 中興通訊標準及開源高級工程師
議題簡介:大模型的趨勢已經勢不可擋,如何提高模型推理效率成為亟待解決的問題。本報告將介紹模型推理優化的技術現狀及趨勢,并分享 Adlik 項目在該領域的實踐。
議題:Xtreme1下一代多模態開源訓練數據平臺
演講時間:14:40-15:00
演講嘉賓:王家軍 | 倍賽科技技術研發總監
議題簡介:UBS Global 研究報告發現:現如今 AI 工程師 70%-90% 的時間都花費在訓練數據上。很多算法在實踐中已非常優秀,數據已然成為 AI 模型開發新的瓶頸。基于以上現狀,倍賽科技團隊研發出 Xtreme1 訓練數據平臺,致力構建最容易觸達的開源 Data-Centric MLOps 基礎設施,以連接人、模型和數據。Xtreme1 首次引入本體 Ontology 來穿透不同 AI 客戶的問題抽象,是全球首個支持多模態數據標注的開源工具,全面遵循云原生架構原則,以保證服務性能的可擴展性,部署規模的可彈性,以及在故障情況下的服務韌性。
議題:OPPO移動端圖形技術領域探索實踐 ——O3DE Mobile WG及shaderNN
演講時間:15:00-15:20
演講嘉賓:彭周虎 | OPPO 開源辦公室負責人
議題簡介:近年來,隨著移動端算力的不斷提升和深度學習研究的快速發展,特別是小網絡模型不斷成熟以及數據安全的要求越來越高,越來越多的原本在云端執行的推理轉移到移動端上來實現。移動平臺的深度學習推理涉及硬件平臺、驅動、編譯優化、模型壓縮、算子算法優化以及部署,適合系統業務開發的高效推理框架成為業界迫切需求和開發重點。
基于移動端圖形圖像后處理高效 AI 推理需求,為降低業務融合成本,提高效能,我們開發了基于 GPU Shader 高效推理引擎 ShaderNN。它直接基于 GPU 紋理進行高效推理以節省 I/O 時間, 不依賴第三方庫,跨不同硬件平臺,支持主流深度學習訓練框架,可定制,方便優化、集成、部署和升級。
議題:英特爾的PyTorch之旅:AI算力提升和開源軟件優化
演講時間:15:40-16:00
演講嘉賓:馬鳴飛 | Senior Deep Learning Software Engineer
議題簡介:PyTorch 是深度學習和機器學習最流行的框架之一,英特爾一直是 PyTorch 社區的長期貢獻者和宣傳者。在本次演講中,我們將分享在核心框架及其生態系統庫中為 PyTorch 做出貢獻的經驗。我們將詳細介紹我們在 torch.compile 中的優化,這是 PyTorch 2.0 的旗艦新功能,并展示其在 CPU 上的性能優勢。我們將展示如何通過硬件算力的提升和開源軟件的優化,讓 AI 應用更加平民化,如基于擴散的生成式 AI 和大語言模型。 我們還將介紹過去參與的一些 PyTorch 生態系統項目,例如 HuggingFace,DeepSpeed,PyG 等等。最后,我們將討論未來的計劃和愿景,繼續與 PyTorch 基金會合作,以推動深度學習和機器學習朝著更好的方向發展。
議題:DeepRec:面向推薦場景的高性能深度學習框架
演講時間:16:00-16:20
演講嘉賓:演講嘉賓:丁辰 | 阿里云 PAI 技術專家
議題簡介:DeepRec 是阿里云機器學習平臺 PAI 開源的面向推薦場景的高性能深度學習框架,針對稀疏模型在分布式、圖優化、算子、Runtime 等方面進行了深度的性能優化,同時提供了動態彈性特征,動態彈性維度,自適應 EmbeddingVariable、增量模型導出及加載等一系列功能。DeepRec 在阿里巴巴集團內部應用于淘寶、天貓、阿里媽媽、高德、淘特、AliExpress、Lazada 等,在核心業務上支撐著千億特征、萬億樣本的超大規模稀疏訓練。DeepRec 開源一年多以來,已經在數十家公司的搜推廣業務場景中大規模應用,帶來了巨大的業務價值。
議題:曠視算法量產與MegEngine生態建設
演講時間:16:20-16:40
演講嘉賓:陳其友 | 曠視科技 MegEngine 團隊負責人
議題簡介:目前 AI 技術應用已經在各種領域得到驗證,它具有比傳統算法更高的生產力。但是隨著大量的 AI 算法的需求,傳統的針對某個具體場景進行數據采集,標注,模型訓練,驗證,交付的算法生成方式成為了 AI 落地的瓶頸。MegEngine 團隊圍繞 MegEngine 訓練框架,提出一種基于各個階段標準化的算法量產的方法來減低 AI 落地的門檻,為了實現算法量產,MegEngine 開發了一系列組件,他們共同形成了 MegEngine 的算法量產的生態,正在逐步開源。
議題:Primus——通用的分布式訓練調度框架
演講時間:16:40-17:00
演講嘉賓:徐合邦 | 字節跳動基礎架構計算框架研發工程師
議題簡介:近些年來,機器學習科技已經深植各應用領域,并且成功帶來顯著的提升。面對與日具增的訓練資料和模型規模,為了滿足更高效率的模型訓練,分布式訓練的概念順應而生。作為一個通用的分布式訓練調度框架,Primus 提供一個通用的介面橋接了分布式訓練任務和物理計算資源,讓資料科學家可以專注與學習算法的設計,并且讓分散式訓練任務可以運行在不同種類的計算集群,例如 Kubernetes 和 YARN。于此基礎上,Primus 更提供了分布式訓練任務所需的容錯能力以及資料調度能力,進而更提升了分布式訓練的易用性。本議題將分享 Primus 在字節跳動的站內現況及實踐,Primus 和分布式訓練領域的相關挑戰、及未來展望。
議題:透明后端圖編譯器無縫提升ML上游框架
演講時間:17:00-17:20
演講嘉賓:Tiejun Chen | Sr. Technical lead
議題簡介:當前有一個新興趨勢:觀測性從云向邊緣轉移,這時 AI 工作負載往往通過高層級 ML 框架(如 Ray)進行管理和編排。但與此同時,各種廠商的 AI 加速器(如 Nvidia GPU 系列、Intel Movidius VPU、Google TPU 等)已經實現了 AI 加速。實際上可以看到許多基于 ASIC 的 AI 加速器。另一方面,存在著各種圖編譯器(如 TVM、Intel OpenVINO、TensorRT 等)用來提高 ML 性能,但碎片化嚴重。因此,在現實世界中用戶在賦予這些異構 AI 加速器不同軟件加速時面臨挑戰,原因是缺少一個自然支持它們的通用統一框架。本次演講將分享引入透明后端加速技術來自動提升流行 ML 上游框架(如 Tensorflow、Pytorch、TorchServe、Tensorflow Serving 等)上異構 AI 加速器上的 ML 性能,并與那些主流 ML 圖編譯器無縫結合。通過我們對主流 ML 框架零代碼更改方法,用戶可以在他們原始的 AI 應用上看到提升的 ML/AI 性能。
議題:OpenGPT:LMM多模態大模型推理框架
演講時間:17:20-17:40
演講嘉賓:王峰 | Jina AI 高級算法工程師
議題簡介:大語言模型和多模態技術已經成為趨勢,以 GPT-4 為代表的 AI 能力的提升,從實現單調的文本交互,轉變為可以接受圖像、文本作為輸入。越來越多基于大模型的多模態技術涌現出來,但是在實際工業產品落地過程中仍然存在諸多挑戰。特別是針對模型推理問題又有更多新的問題需要解決。本次分享將以 OpenGPT 項目為例來介紹 Jina AI 在解決大模型產品落地問題的實踐。
0635
全球開源技術峰會(Global Open-source Technology Conference,簡稱 GOTC)是由開放原子開源基金會、 Linux 基金會亞太區、上海浦東軟件園和開源中國聯合發起的,面向全球開發者的一場盛大開源技術盛宴。
GOTC 2023 將于 5 月 27 日至 28 日在上海張江科學會堂召開。大會將以行業展覽、主題發言、特別論壇、分論壇的形式展現,與會者將一起探討元宇宙、3D 與游戲、eBPF、Web3.0、區塊鏈等熱門技術主題,以及開源社區、AIGC、汽車軟件、AI 編程、開源教育培訓、云原生等熱門話題,探討開源未來,助力開源發展。
GOTC 2023報名通道現已開啟,誠邀全球各技術領域開源愛好者共襄盛舉!
審核編輯黃宇
-
AI
+關注
關注
87文章
30747瀏覽量
268899 -
開源
+關注
關注
3文章
3320瀏覽量
42473
發布評論請先 登錄
相關推薦
評論