簡介:驗證 DataStage 作業的需求
如今,企業正在實施以資訊為中心的項目來轉型其業務,並實 現成本節省。許多Data Integration或資訊整合應用程式或流程都包含 ETL 並作為其中一個組件。
通常,一個 ETL 流程(工作單元)旨在完成以下工作:
提取:從源系統提取資料並進行整理。
轉換:將資料轉換為可在下一步中使用的所需格式。通常,這將涉及到應用核心商務邏輯來將資料轉換為 資訊。
載入:通常,將資料載入到資料庫表/倉庫中,以供報告引擎用於從轉換的資料中擷取洞察。
一個Data Integration應用程式中的作業會經曆兩個常見的生命週期
將作業從舊版本移植/遷移到運行其的 DataStage 軟體或硬體的新版本上。
將作業從開發環境遷移到測試環境,再遷移到生產環境。
上面兩種用例都需要驗證大量 DataStage 作業。企業通常驗證在軟體的新版本或新硬體環境中啟動並執行作業 是否會產生與以前相同的結果,這會讓他們確信新系統可以替代舊系統。類似地,在將Data Integration流程中的一個 作業部署到生產環境中之前,必須確定開發、測試和生產環境中具有預期的行為。
本文將提供一個分 步樣本,展示 DataStage 使用者如何使用 IBM InfoSphere Optim Test Data Management Solution 驗證 ETL 作業的結果。
將 Optim Test Data 解決方案用於 DataStage
在 DataStage 作業的驗證流程中 ,Optim Test Data Solution 可用於
產生測試資料
將作業輸出與一個預期或基準輸出進行對比
在驗證過程中,DataStage 作業將引用產生的測試資料作為輸入來源。執行 DataStage 作業後,將執行對 比步驟來驗證最終的輸出。
該工作流程可按圖 1 來表示。
圖 1. 使用 Optim TDM 驗證 DataStage 作業的工作流程
在後續的各節中,您將看到這樣一 個樣本:使用 DataStage 作業產生測試資料,然後將最終結果與已有的預期結果進行對比以驗證作業。