IBM Infosphere Data Replication產品族Replication Server與Change Data Capture的異同比較
一,簡介
在如今資訊快速變化的商業時代,必須在第一時間做出商業決策並採取行動才能在激烈的競爭中保持領先地位。如果商業資料不能保證同步,那麼生產和利潤勢必會遭受損失,但是,面對資訊量激增並且分布儲存的特點,保證資料的可信性並非易事。 IBM 的 InfoSphere Data Replication 產品族針對這一問題為應用提供了一系列資料同步解決方案,該類方案均為基於資料庫日誌實現對資料來源變化的即時捕獲,並且即時傳輸到目標端。本產品族包括 InfoSphere RS(Replication Server)和 InfoSphere CDC(Change Data Capture)兩個產品。
二,產品介紹及其架構對比
1,Replication Server(RS)
Replication Server 產品包括 SQL 複製和 Q 複製兩種技術。其中 SQL 複製(其前身為 Data Propagator)於 1994 年發布第一個版本,Q 複製於 2004 年發布第一個版本,如今已經發布了 V10FP1。相比於 SQL 複製,Q 複製的資料轉送技術藉助於 IBM 隊列機制,從而提高了資料的傳輸效率和可靠性,可以達到每秒複製幾千個表、幾十萬行資料 , 在幾千英裡的距離下端到端的延遲不到 1 秒(從源端 DB2 commit 到目標端 DB2 commit)。本文將主要介紹 Q 複製技術與 CDC 的對比。
如圖 1 表示了 Q 複製的主要組件及其複製原理。其中主要的組成部分包括:
a).QCapture 程式,運行在來源資料端,主要功能為從來源資料庫的日誌中讀取變化的資料,產生 MQ 訊息並且將其放入 WebSphere MQ 隊列,一般情況下每一條 MQ 訊息代表一個資料庫事務,訊息的格式遵循一定的標準。
b).QApply 程式,並行地從隊列中擷取 MQ 訊息,對訊息中自主資料庫操作經過衝突檢查、衝突處理等一系列分析處理產生相應的資料庫操作,將來源資料庫中的資料變化反映到到目標表中。其中目標表可以是多種資料庫,除 DB2 外,還可以藉助於聯邦資料庫將資料變化複製到 Oracle, Sybase, Informix, SQL Server, Teradata 這些資料庫中。
c).Websphere MQ,為 QCapture 和 QApply 之間提供資料轉送功能,藉助了 MQ 本身的健壯性和高效能。
圖 1. Q 複製的主要組件及工作原理
2,Change Data Capture(CDC)
Change Data Capture(CDC) 的前身是 DataMirror,2007 年由 IBM 收購後正式更名為 CDC,並發布了收購後的第一個版本 V6.3,現在最新的版本為 V10.2。CDC 主要採用基於日誌的變更資料擷取技術以實現對關鍵業務系統的即時資料複製,同時不影響業務系統效能。CDC 最大優點在於其對異構資料庫的支援和與 IBM 產品的整合,為客戶在資料移轉,整合,同步,動態資料倉庫等應用中提供了卓越的解決方案。
圖 2 顯示了 CDC 的關鍵組件及其複製原理,其主要的組成部分包括:
a).Access Server(AS):使用者配置和監控 CDC 引擎的安全管理工具,支援圖形化介面(V6.5 之後整合在 MC 中)及命令列
b).Management Console(MC):CDC 的圖形化介面工具,用於管理和配置複製資訊,並對複製狀態進行即時監控,擷取 CDC 運行資訊
c). 源端引擎:讀取源端資料庫的記錄檔捕獲變更資料,經過行列過濾,字元編碼轉換後由 TCP/IP 發送給目標端
d). 目標端引擎:接收源端發送的變更資料,經過數值轉換,字元編碼轉換,衝突檢測後將變更資料應用到目標資料庫
e). 多數的 CDC 引擎既可作為源端引擎捕獲變化資料又可作為目標端引擎接收變化資料並將其應用於指定的資料庫;通常,CDC 引擎稱為 CDC 執行個體,如果從 AS/MC 的角度,一個 CDC 引擎也被稱作一個 CDC 資料存放區
f). 中繼資料:儲存 CDC 執行個體的配置資訊,包括資料庫連接資訊,預定資訊以及表的映射資訊等,同時記錄當前的複製進行狀態
圖 2. CDC 關鍵組件及複製原理
3,比較
RS 和 CDC 支援目前市場應用中的大部分資料庫系統之間的複製,以下是二者支援的資料來源,目標,訊息佇列及作業系統的對比:
查看本欄目更多精彩內容:http://www.bianceng.cnhttp://www.bianceng.cn/Programming/extra/