此次TigerGraph在 36TB 規模的 LDBC SNB(社交網絡基準) 基準測試,為全新的測試,完全遵循了LDBC規范,所有BI query都通過測試(該報告中包含了所有結果),包含5396億條邊和726億個頂點。到目前為止,TigerGraph依然是唯一可以完成36TB LDBC BI workload的圖數據庫供應商,并且完全可以通過第三方審計。
新的基準測試使用了新版本的TigerGraph,在加載和查詢方 面都有改進(例如,加載時間從 35.5 小時縮短到6.5 小時,提升了將近5倍。power batch 的平均查詢時間從236.06秒縮短到99.90秒),提升了1.4倍。并且結果得到了SF-10上的另一個圖數據庫的交叉驗證。
該報告記錄了TigerGraph在SF-30k上的LDBC SNB BI工作負載的完整執行。這個基準測試正在等待LDBC的審計,它使用的官方基準驅動程序、查詢實現、數據和替 換參數生成器,都與TigerGraph在LDBC SNB SF-1000的審計報告中使用的相同。不同的是,這次的規模因子為SF-30k(即30TB級別)。在每批的查詢中使用5個替換參數執行,而官方基準測試使用30個不同的參數。power 和throughput 基準指標都是按照LDBC SNB規范的指南報告。
TigerGraph 是一個大規模并行處理 (MPP) 圖數據庫管理系統,旨在處理混合事務/分析處理 (HTAP) 查詢工作負載。它是一個分布式平臺,使用原生圖存儲格式和領先的分區策略。其中,每個圖分區都包含相似數量的頂點和邊,支持并行處理請求。TigerGraph提供 GSQL,這是一種圖靈完備的查詢語言,它具有聲明式特性(例如,圖模式匹配)和命令式特性(例如用于表達帶有循環和累加器原語的迭代圖算法)。
該基準測試的重點是 TigerGraph 在一系列批量刷新的大圖上的商業智能 (BI) 工作負載性能。BI 工作負載包括:
20 個只讀查詢——大多數 OLAP 式的迭代和深度鏈接圖查詢在不到一分鐘到幾分鐘內就可以得到回答。查詢包括加權圖上的爆炸性和冗余多連接以及多源最 短路徑問題。
增量批量更新——圖通過一組插入和刪除操作而發生變化。插入或刪除數據的批量處理周期為1天。
TigerGraph 服務器被部署在 36 個具有144TB 磁盤容量的Amazon Web Service (AWS) r6a.32xlarge 實例上。這些實例由第三代 AMD EPYC 處理器提供支持。以下摘要突出了一些關鍵數字:
總體而言,完整的源數據集約為36TB,包含5396億條邊和726億個頂點。
基準測試總時間為19.3 小時,包括初始數據加載、1 次 power batch運行和 1 次throughput batch運行。
硬件成本為281.27 美元/小時,包括 36 臺 A WS 機器和144T GP2 SSD 卷
該基準測試清楚地證明了:
TigerGraph在執行復雜查詢時能夠擴展到更大的數據集的空前能力,這被認為比關系聯接更具挑戰性;
TigerGraph適用于各種關系數據處理場景,尤其在數據量大、經常有數據更新、需要快速實現復雜大數據量全圖計算(OLAP)的場景表現格外優異;
TigerGraph在實際生產環境中處理大圖工作負載的能力,在這種環境中,數十TB的關聯數據每小時或每天增量更新是一種常態。據我們所知,其它圖數據庫或關系數據庫供應商,沒有一家可以在這種大規模可更新的圖上展示出同等的分析和操作能力。
審核編輯 :李倩
-
數據庫
+關注
關注
7文章
3794瀏覽量
64362 -
生成器
+關注
關注
7文章
315瀏覽量
21003
原文標題:LDBC SNB SF30000 基準測試報告全面披露
文章出處:【微信號:TigerGraph,微信公眾號:TigerGraph】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論