更改數據捕獲 (CDC) 被廣泛定義為跟蹤數據庫中的更改。跟蹤變化的目的是多種多樣的。嵌入式數據庫系統中的 CDC 可以通過幾種不同的方式實現,這些方式有時對應用程序是不可見的,應用程序可以利用這些方式進行數據共享、響應事件和增量備份。
第一個,可能也是最明顯的,在嵌入式數據庫中實現 CDC 是實現事務的 ACID 屬性的一部分:原子性、一致性、隔離性和持久性。將事務成功應用到數據庫會將該數據庫從一種一致狀態轉移到新的一致狀態。相反,事務對數據庫的不成功應用必須使數據庫返回到事務應用不成功之前存在的一致狀態。為了滿足這些要求,數據庫管理系統必須跟蹤變化。實現細節因數據庫系統而異,甚至在數據庫系統系列中,從純內存數據庫、持久內存數據庫、
在純內存數據庫的情況下,沒有用于記錄更改的事務日志。因此,在事務處于活動狀態時,需要將更改或更改記錄的前映像保存在緩沖區中,以便數據庫可以在事務中止時恢復到其事務前狀態。
對于具有持久性的內存數據庫,所有更改也附加到存儲在持久媒體上的事務日志中,可以在崩潰后重播以進行恢復。
對于持久性(基于磁盤的)數據庫,還使用事務日志記錄,以優化性能并支持從崩潰中恢復。在這種情況下,可以提供兩種形式的事務日志記錄:UNDO 日志記錄和預寫日志記錄 (WAL)。WAL 如上一段所述。UNDO 日志將更改記錄的前映像寫入事務日志文件。在發生崩潰時,UNDO 日志信息用于回滾不完整的事務(即,將數據庫返回到最后一致的狀態)。
在某些數據庫系統中,CDC 的另一個內部使用是通過 MVCC(多版本并發控制)實現樂觀并發控制。樂觀并發控制意味著應用程序不必獲取鎖,這也意味著應用程序永遠不必等待另一個應用程序持有的鎖。這要求數據庫系統知道兩個應用程序是否試圖同時修改同一個數據庫對象。這是通過跟蹤提交事務時檢查的版本號來完成的(因此名稱,多版本并發控制)。如果對象的版本在應用程序獲取對象副本的時間和應用程序想要對該對象提交更改的時間之間發生了變化,則意味著另一個應用程序首先修改了底層對象,并且必須中止并重試該事務。 MVCC 背后的理論是,這種沖突很少見,偶爾重試比總是必須獲取鎖并可能用這些鎖阻塞其他應用程序更有效。
CDC 還用于需要“五個 9”可用性(即 99.999% 正常運行時間)的系統的高可用性 (HA) 實施。HA由不同的數據庫供應商以不同的方式實現:實時事務復制,SQL語句復制,日志文件轉發等。有所謂的1-safe(又名lazy,異步)和2-safe(又名渴望,同步) ) 實現。例如,實時事務復制可以是 1-safe 或 2-safe(在e X treme DB 中,我們將其稱為時間認知兩階段提交);日志轉發本質上是 1 安全的。
CDC 可以在嵌入式數據庫和/或第三方系統中用于可在應用程序中使用的其他目的:開放復制、觸發器/事件通知和增量備份。
一些嵌入式數據庫系統實施復制以例如支持高可用性和/或數據庫集群。這樣的系統可以很容易地在同一數據庫系統的兩個或多個實例之間復制數據或事務,但是當需要從嵌入式數據庫復制到任何其他目標時,它們不是解決方案。有第三方產品試圖填補這一空白,例如 Actian DataConnect 和 Oracle Golden Gate。或者通過自定義提取-轉換-加載 (ETL) 解決方案,該解決方案可能對源和/或目標數據庫中的更改敏感。
觸發器和事件通知方案是變更數據捕獲的經典用例。畢竟,觸發器是在指定表的 INSERT、UPDATE 或 DELETE 語句執行時觸發的。換句話說,數據發生了變化,觸發器捕獲了該變化,周圍系統以某種方式對其進行操作。
嵌入式數據庫系統中變更數據捕獲的最后一個重要目的是實現增量備份設施。必要時,增量備份方案必須知道在上次完整快照或上次增量備份之間數據庫中發生的增量更改。
結論
變更數據捕獲是任何數據庫管理系統的核心。它有助于實施并發性和持久性、復制、觸發器/事件通知以及備份和恢復的 ACID 屬性。
審核編輯:郭婷
-
嵌入式
+關注
關注
5086文章
19140瀏覽量
305875 -
數據庫
+關注
關注
7文章
3816瀏覽量
64472 -
觸發器
+關注
關注
14文章
2000瀏覽量
61201
發布評論請先 登錄
相關推薦
評論