2023 開放原子開發者大會
OPEN ATOM DEVELOPERS CONFERENCE
2023.12.16
隨著 AI 大模型的廣泛應用和普及,其模型訓練和推理的精準度對數據和信息的存儲、檢索、處理提出了更高的要求。為此,存算分離、向量化數據庫、圖數據庫、分布式數據庫和開源數據庫等受到了前所未有的關注。12 月 16-17 日,2023 開放原子開發者大會(OADC)即將召開,“AI 時代數據庫存儲管理新挑戰”分論壇將聚集國內頂尖的數據庫技術團隊,為開發者們提供 AI 時代數據庫技術的最新進展和實踐經驗分享。
AI 時代數據存儲管理新挑戰分論壇將于 12 月 16 日下午舉行。接下來,我們精選一些議題介紹,以饗讀者。
時序數據庫 CeresDB 技術揭秘
演講嘉賓:
曹瑞秋,螞蟻集團開發工程師,CeresDB 核心開發者,長期專注于時序數據庫領域,熱愛數據庫、開源。畢業自華南理工大學,畢業后即加入 CeresDB 項目組,深度參與過 CeresDB 多個模塊的研發與性能優化工作。
議題簡介:作為一種新型的時序數據庫,CeresDB 的設計目標是高基數時序場景處理能力以及原生分布式能力。會上將分享 CeresDB 的一些核心技術細節,例如存儲格式(與經典時序數據庫的存儲格式對比);分布式集群方案,包括數據分片和負載均衡策略;查詢路徑優化,包括分布式查詢、查詢友好的 memtable、數據拉取和緩存等,以及 CeresDB 在螞蟻集團生產場景中的應用及其效果。
數據庫增強計算引擎
數據庫架構革新新思路
演講嘉賓:
張亮,SphereEX 創始人,數據庫領域知名實踐者,擁有超過 10 年的數據庫領域探索、實踐經驗,熱愛開源,擅長分布式架構,推崇優雅代碼。曾在多個大型互聯網集團公司任職架構、數據庫團隊負責人。Apache Member 、微軟 MVP 、阿里云 MVP、騰訊云 TVP、華為云 MVP、Apache ShardingSphere 創始人 & PMC Chair。是《未來架構——從服務化到云原生》《A Definitive Guide to Apache ShardingSphere》書籍作者,在 ICDE 發表論文《Apache ShardingSphere:A Holistic and Pluggable Platform for Data Sharding》。
議題簡介:了解數據庫增強引擎的創新理念和技術特點,打破傳統數據庫的限制。源于數據庫頂級會議 ICDE 的論文,深度解析新一代數據庫架構增強引擎的設計理念、技術特點和應用場景。
TiDB Serverless:
構建一個云原生的 Serverless 數據庫
演講嘉賓:
張翔,PingCAP/TiDB Serverless 生態負責人,Python 核心開發者。
議題簡介:如何將一個分布式數據庫改造成一個 cloud native 的 serverless 數據庫,從而給客戶提供更好的服務和更低的價格,服務 modern development。新的架構帶來新的使用場景,cloud native 的架構使得 TiDB Serverless 可以推出 database branching 這種功能,提升用戶的效率和協作體驗,將數據庫融入到 CICD。
DingoDB:融合 SQL 與向量
構建功能完整的 RAG 數據庫底座
演講嘉賓:
孟圣智,九章云極 DataCanvas 資深架構師,DingoDB 多模向量數據庫主要設計者和開發者之一,擁有多年社區開源項目開發經驗,在分布式數據庫、Serverless 計算、虛擬化和容器平臺、高并發系統設計方面有較深入的研究,對分布式存儲系統和分布式數據庫方向有獨到的理解。
議題簡介:介紹支持融合 SQL 與向量檢索多模向量數據庫的技術架構;融合 SQL 支持與 Vector First-Class Citizen 的支持,提供豐富的 API 訪問方式;基于 Multi-Raft 實現向量索引的實時構建與優化。
云原生批流融合數據平臺
助力 AI/LLM 的實時數據處理
演講嘉賓:
翟佳,StreamNative 聯合創始人, Apache Pulsar PMC 成員和 Apache Member。主要從事分布式、文件系統、流存儲相關的設計和開發。近年一直從事開源項目 Apache BookKeeper 和 Apache Pulsar 的設計開發和社區運營工作。他在分布式、存儲、消息等領域有豐富的積累和經驗,在工作過程中,在相關領域先后獲得中美專利 10 余項。
議題簡介:1、了解 LLMs 對實時數據的需求;2、 介紹 Event/Streaming 系統怎樣配合 LLMs 提供更高效的服務;3, 介紹 Apache Pulsar 及其在 LLMs 數據流轉中優勢。
騰訊云 TDSQL 平滑去 O 的機遇挑戰
與開源實踐
演講嘉賓:耿航,目前擔任騰訊開源專家,同時兼任木蘭開源社區運營負責人,中國科協“科創中國”開源技術傳播工委會秘書長,中國計算機學會開源發展委員會首批執委,NextArch 基金會技術監督委員會成員、SODA 基金會外聯委員會成員、Ceph 基金會全球大使、中國開源云聯盟副秘書長。
議題簡介:分享騰訊云分布式數據庫 TDSQL PG 是騰訊內部深度實踐的分布式數據庫,歷經金融、游戲、廣告、社交等業務打磨 10 年之久,逐步推廣到千行百業落地應用。TDSQL 團隊十年磨一劍,當前在面對數據庫升級和替換過程中的機遇和挑戰,將會和業界一起打磨共創商業數據庫語法兼容生態和開源生態,更好的助力企業數字化轉型,應對海量數據的高性能和高可用的挑戰,以及降低用戶的使用門檻,本次將為大家分享騰訊云 TDSQL 平滑去 O 的實踐與開源實踐。
openGauss 內核架構雙引擎
驅動大規模數據處理
演講嘉賓:胡正超,華為 openGauss 內核技術專家,就職于華為技術有限公司,參與 openGauss 內核技術研發與探索相關工作,負責 SQL 引擎、DFX 能力、性能優化方面的研發工作。目前 openGauss SIG SQL/OPS Committer。
議題簡介:介紹在高性能、高可用、高智能、高安全上的創新特性。DataPod 三層資源池化架構技術,DataKit 數據庫全生命周期管理工具。即刻報名,了解更多數據庫技術進展。
掃描下方二維碼
報名參加 AI 時代數據庫存儲管理新挑戰分論壇
審核編輯 黃宇
-
AI
+關注
關注
87文章
30728瀏覽量
268887 -
數據庫
+關注
關注
7文章
3794瀏覽量
64362 -
開源
+關注
關注
3文章
3309瀏覽量
42471
發布評論請先 登錄
相關推薦
評論