Sap MDM(Master Data Manager主要資料管理)主要用於主要資料的清洗比對,整合不同系統間的主要資料間的不一致,以保證基於主要資料的交易(資料交換)順利進行。
主要資料的概念
首先介紹一下什麼是主要資料。這裡借用其他網站的一個資料分類模型,我們可以看到有中繼資料(metadata),引用資料(Reference
Data),主要資料(Master Data),企業結構資料(Enterprise
structure Data),交易活動資料(Transaction
Activity Data),交易審計資料(Transaction Audit Data)這六大類資料。
簡要解釋一下這六大類的資料,關於這些資料分類的定義可以在網上很容易的找到。
中繼資料:資料的資料,平時我們設計表時,大部分屬性欄位就是中繼資料。比如,性別,國籍,出生省份等。這個是最接近自然意義的的資料。
引用資料:中繼資料的可能取值範圍,我們設計表時所說的資料字典往往就是引用資料。比如,性別只能是男和女,男和女就是引用資料。國家的引用資料就是世界上這100多個國家和地區;
主要資料:在我們資料庫設計中最重要的一些實體,是由中繼資料和引用資料執行個體的集合。DMReview 專欄作家 Jane
Griffin 將主要資料定義為“...用於為核心業務實體建立和維護全企業‘記錄系統’,以記錄業務交易並評定這些實體的業績所需的資訊。”平時我們常碰到的客戶資訊,產品資訊都屬於主要資料。對於主要資料的介紹,我們會在後面詳細展開說明。
企業結構化資料:企業業務中所需的資料實體 ,可能是多個主要資料的集合。不同行業的結構化資料會有很大不同。
交易活動資料:主要資料之間活動產生的資料。比如客戶購買產品的交易記錄就是交易活動資料,工廠生產產品,生產記錄也是交易活動資料。
交易審計資料:我們對資料的所有活動都通過交易審計資料進行記錄。比如我們對客戶資訊修改的操作,對交易的增加和刪除操作,這些活動在很多關鍵系統(比如銀行)都需要記錄,以合符相應法規的要求(如 Basel II、薩班斯—奧克斯利法案)。
中資料模型中的藍色越深代表語義相關性越強和資料品質越重要,而黃色越深代表資料的資料數量越多、更新的頻率越快、即時抓取的資料越快、資料的生命越短。可以看到,中繼資料的資料語義性最強,幾乎不更新,資料量最少,生命週期最長。
(以上介紹源於http://blog.csdn.net/woohooli/archive/2009/01/07/3726040.aspx)
從以上介紹可以總結出:主要資料在系統內部是相對穩定不變的;而交易資料建立在主要資料基礎之上的。其實想象一下兩個系統進行交換,如果最基本資料(如產品的品種,顏色,大小,規格等)不統一,那麼基於此的業務資料(如買賣資訊)是無論如何也無法交換下去的,這就是為什麼提出主要資料管理的原因,只有主要資料統一了,交換才能進行下去。
SAP MDM提供了一整套主要資料解決方案,包括,資料整合,資料清洗比對等,結合SAP的XI(PI,資料轉送交換工具),可以實現資料匯入匯出(或發布)。整體理解SAP
MDM資料結構與當前的關係型資料庫差別很大,但主要功能無非是在多種結構的資料間建立一套對應關係,保留合并一致資料,摒棄錯誤矛盾資料,為多個系統的主要資料建立一個合并規則,這個過程稱之為清洗。最終將清洗好的資料通過PI發布到各個應用系統上。