現在,複雜的“可熱插拔”系統和服務導向架構 (SOA) 得到了廣泛應用,這使得將資料合理地整合在一起的難度日益增加。儘管您的主要應用程式資料庫在 Oracle 資料庫上運行,但是可能還有其他較小的系統在其他供應商提供的資料庫和平台上運行。您的應用程式本身可以通過 Web 服務之類的技術進行互動,應用程式和資料可以遠程託管,也可以由您在企業資料中心內進行管理。
Oracle Data Integrator 屬於 Oracle 融合中介軟體產品系列,它解決了異構程度日益增加的環境中的Data Integration需求。它是一個基於 Java 的應用程式,可以使用資料庫來執行基於集合的Data Integration任務,也可以將該功能擴充到多種資料庫平台以及 Oracle 資料庫。此外,通過它,您還可以通過 Web 服務和訊息提取並提供轉換資料,以及建立在服務導向架構中響應和建立事件的整合過程。
Oracle Data Integrator 產品體繫結構
Oracle Data Integrator 是以 Java 圖形模組和調度代理訪問的模組化資訊庫為中心進行組織的。圖形模組用於設計和構建整合過程,代理用於安排和協調整合任務。當 Oracle Data Integrator 項目投入生產時,資料管理員可以使用基於 Web 的 Metadata Navigator 應用程式來根據資訊庫中的中繼資料產生報告。現成的知識模組可以使用特定於平台的代碼和工具跨異構平台提取和載入資料。
Oracle Data Integrator 資訊庫包含一個主資訊庫(包含有關使用者和角色的詳細資料)、到資料庫和其他資料來源的串連、項目版本以及一個或多個工作資訊庫(包含資料模型的詳細資料以及用於整合資料的映射)。這些資訊庫可以儲存在 Oracle 和非 Oracle 關聯式資料庫中,可以使用圖形模組進行管理,並可以在運行時由代理進行訪問。
有四個圖形模組可用來建立和管理 Oracle Data Integrator 項目:
- Designer 用於定義資料存放區(表、檔案、Web 服務等)、介面(資料對應)以及程式包(包括介面在內的幾組整合步驟)。
- Topology Manager 用於建立和管理到資料來源和代理的串連,通常限制為只有管理員可以訪問。
- Operator 用於查看和管理產品整合作業。
- Security Manager 系統管理使用者及其資訊庫許可權。
這些基於 Java 的應用程式可在包括 Microsoft Windows、Macintosh OS X 和 Linux 在內的任何 Java 環境中運行。
聲明式設計:一般來說,Data Integration任務涉及兩個主要的領域:
- 關於轉換哪位元據並將其與其他位相結合的商務規則
- 關於資料的實際提取、載入等操作方式的技術細節
這種劃分意味著,定義商務規則的人通常是機構的技術業務專家或資料專家,而技術細節則往往留給開發人員和 DBA 等技術人員來定義。使用大多數Data Integration工具,通常很難以這種方式劃分職責,因為它們的資料對應特性在同一個資料對應中混合了商務規則和技術實現細節。而 Oracle Data Integrator 採用了一種不同的方法,像 SQL 一樣使用聲明式方法來構建資料對應,這在工具中稱為“介面”。
建立新的介面時,開發人員或技術業務使用者首先定義要整合的資料以及應使用的商務規則。在該步驟中,會將表聯結在一起,應用過濾器,並使用 SQL 運算式來轉換資料。所使用的特定 SQL 語言由執行代碼的資料庫平台來決定。
然後,在另一個步驟中,技術人員可以使用特定於資料庫的工具和設計方法(例如增量載入、批量載入工具、漸層維度和更改資料擷取)以最有效方式來提取、組合并整合該資料。