當地時間2019年8月26至30日,VLDB 2019會議在美國加利福尼亞召開,騰訊分布式數據庫TDSQL與中國人民大學最新聯合研究成果被VLDB 2019接收并將通過長文形式發表。VLDB是國際數據管理與數據庫領域頂尖的學術會議之一,這是繼去年騰訊TDSQL相似度計算的論文被VLDB錄用后,騰訊TDSQL再一次邁進VLDB殿堂。
論文中,騰訊介紹了基于TDSQL擴展而來的全時態數據庫系統(T-TDSQL)。該系統在保證OLTP性能的前提下,提供了輕量級的全時態數據管理功能和全時態數據的事務處理能力,以及集當前態數據于生產系統、集歷史態數據于分析型系統的集群架構,構成了全時態數據的完備解決方案。
當前態數據庫和歷史態數據都是具有價值的,并且全時態數據為數據安全、數據重演、數據挖掘和AI技術的施展提供了物理基礎,還可以進一步建立數據之間的關聯關系以實現“數據血統”的邏輯等,這使得TDSQL具備了在海量全時態數據上的分析計算能力。
一般主流數據庫由于技術復雜度原因,不會保存歷史態數據,丟棄了有價值的歷史態數據,這成為許多企業機構數字化時代面臨的痛點。騰訊分布式數據庫TDSQL推出的具備海量時態數據計算能力的解決方案T-TDSQL,突破在于具備全時態數據模型,全時態數據存儲、查詢、計算等特性,并在保持全局一致性的基礎上擁有高效的性能,真正實現為數據賦能。
據了解,論文提出了一種拓展的全時態數據模型,并提供了內建的全時態數據庫解決方案,在針對TDSQL進行大量優化后,最終實現TDSQL全時態數據庫系統。通過引入異步數據遷移、增量歷史數據管理、原生全時態查詢執行器等策略,使得該解決方案可實現輕量且高效的全時態數據管理計算。
通過TPCC測試基準,基于TDSQL實現的全時態數據庫系統的系統性能相較于原始TDSQL下降率均值不到6%,領先于其他基于傳統關系數據庫實現的時態數據庫系統。另外,基于真實的批處理業務場景實驗結果顯示,騰訊全時態數據庫系統在簡化業務應用開發的同時,可以縮短近一半的業務執行時間。
更重要的是,該解決方案具有很強的通用性,可以方便地引入到其他數據庫系統中。
圖 TPCC測試結果
圖 實際業務場景測試
TDSQL是騰訊TEG計費平臺部自主研發的金融級分布式數據庫,十幾年來承載了騰訊近90%的金融、交易、計費類業務。從2014年開始,TDSQL通過騰訊金融云平臺對外開放,提供穩定可靠的云數據庫服務,目前在公有云上服務金融機構500余家,為中國銀行、微眾銀行在內的超過44家銀行及政企機構提供專有云服務。
TDSQL一直致力于數據庫技術自主研發投入,在VLDB 2018上,騰訊TDSQL通過Short Paper展示了合作成果MSQL+ ,一個基于TDSQL的插件式近似查詢工具
https://mp.weixin.qq.com/s/BZZOH20NfRyCltPkl7Q7_Q。今年是TDSQL連續第二年參加VLDB,并向學界貢獻領先的研究成果。同時,騰訊TDSQL持續通過騰訊高校合作犀牛鳥科研專項、高校聯合實驗室等平臺與學界建立科研合作,推動技術創新。本次入選論文也是基于與人大長期高校合作產出的優秀成果。
在不斷提升性能、完善配套服務之余,包括TDSQL在內的騰訊云數據庫也一直秉承開放、共享的心態參與開源。未來,TDSQL將繼續加大技術投入,持續提升產品能力,助力企業數字化轉型升級。
評論
查看更多