簡介
IBM InfoSphere Information 伺服器由一套可協助企業從遍布多個資料來源系統的資訊中擷取 業務價值的Data Integration產品組成。它有助於以某種具有成本效益的方式從多個異構資料來源中分析、清理和整合信 息。有了 IBM InfoSphere Information Server,企業能夠以較低的成本和風險提高其運營效率。
IBM Information Server DataStage 是一個 ETL 產品,可協助組織擷取、轉換和下載來自異構資料來源的資料。 DataStage 可使用其高效能並行架構通過整合各種資料來源來解決複雜的業務問題。
DataStage Java Integration Stage 和 DataStage JavaPack plug-ins
Java Integration Stage 是一個 DataStage Connector,可以使用它從 InfoSphere Data Stage 和 Quality Stage 並行任務中調用一個自訂 Java 應 用程式。Java Integration Stage 在 IBM InfoSphere Information Server 9.1 或更高版本中提供。Java Integration Stage 可用於以下拓撲結構中:作為一個源、作為一個目標、作為一個轉換器、作為一個尋找階 段。
DataStage Java Pack 是兩個外掛程式階段(Java Transformer 和 Java Client)的集合,可以通過 它來調用 DataStage 中的 Java 應用程式。Java Pack 在 DataStage 7.5.x 或更高版本中提供。
Java Transformer 階段是一個主動階段,用於調用一個 Java 應用程式,該應用程式可讀取輸入資料 並對其進行轉換,然後將其寫入 DataStage 作業中定義的輸出連結。Java Client 階段是一個被動階段,可 作為一個源、一個目標以及一個尋找階段使用。作為目標階段使用時,Java Client Stage 將使用資料。作為 一個尋找階段時,Java Client Stage 將執行尋找功能。
您可以使用 Java Integration Stage (Unstructured Data Stage)或者任何 Java Pack Stages 來提取 Excel 資料。具體情況取決於部署的 Information Server 版本。如果您使用的是 Information Server 9.1,那麼可以使用 Unstructured Data Stage 或 Java Integration Stage 來提取 Excel 資料。如果您使用的是 9.1 之前的版本(比如,8.7.x、 8.5.x、8.1.x、8.0.1 和 7.5.x),則必須使用 Java Pack Stages(Java Transformer Stage 或 Java Client Stage)從 Excel 檔案中提取資料。本文將介紹如何使用 Java Integration Stage 和 Java Pack Client Stage 來提取 Excel 資料。
DataStage Java Integration Stage 和 Java Client Stage GUI 屬性
Java Integration Stage GUI
Java Integration Stage 和 Java Client Stage 在 DataStage Designer Palette 的 Real Time 階段提供。要使用 Java Integration Stage 和 Java Pack Stages,需要啟動 DataStage Designer,建立一個新作業,擴充 Palette 中的 Real Time Stages 類別,然 後拖拽該階段。
圖 1. Palette 中的 Java Integration Stage 和 JavaPack Stages
Java Integration 階段根據不同的使用環境(源、目標和尋找)支援不同的屬性。必須設定階段屬性來定義 JAVA 虛擬機器配置以及從 Java Integration 階段調用的 Java 類。輸入連結和輸出連結屬性必鬚根據作業設計進行 配置。
圖 2. 階段屬性