BI—SSIS初步認識,BI—SSIS認識

來源:互聯網
上載者:User

BI—SSIS初步認識,BI—SSIS認識

         在上一篇中簡單的介紹了BI的整體架構,在接下來的幾篇就是針對某個知識點簡單講解。首先我們就進入SSIS的學習。

一、是什嗎?

        SSIS(SQL Server Integration Service)是微軟的一個智能解決方案,通俗點和ASP.NET程式差不多,它也設計了很多的類似控制項的東西,不過叫任務,這些任務的主要功能是將資料從資料來源轉到資料目的,中間也會有查詢,彙總等等更加具體的任務。


二、怎麼用?

        那麼SSIS是一個智能的解決方案,怎麼使用呢?接下來就根據執行個體進行詳細的說明:

題幹:兩張表結構


解釋:

(1)employee(員工表):店面員工資訊

          employee:id(主鍵 自增)name(員工姓名)birthday(出生日期)idCard(證件號碼)idType(證件類型 1為身份證) empNo為員工編號

(2)employee_internet(網路員工表):網路員工資訊

          employee_internet:id(主鍵 自增)name(員工姓名)birthday(出生日期)idCard(證件號碼)idType(證件類型 為中文身份證) empNo為員工編號

ETL過程:請將employee_internet表資訊根據idCard(證件號碼)合并到employee表中

解決方案的過程:

分析:

        首先根據題幹得到根據idCard合并兩個表,但是兩個表中idType的類型不一樣,這就是問題的關鍵,所以先根據證件類型不同派生出另一個欄位,然後進行合并

過程:

1、建立SSIS專案檔

   (1)在開始菜單中,找到SQL資料庫檔案下的SQL Server BusinessIntelligence Development Studio程式,單擊運行程式。

   (2)在開啟的頁面中,點擊左上方的“檔案→建立→項目”,在”商業智慧”項目目錄下選擇”IntegrationService”項目,填入名稱和位置,點擊確定。


 

2、開啟現有的SSIS專案檔

      找到需要開啟SSIS項目的檔案夾,開啟檔案。找到檔案尾碼名為.sln的檔案,並運行該檔案

3、頁面介紹

      功能表列、工具箱、設計區、連線管理員、方案總管等

              功能表列:所有的菜單選項

           工具箱:所有的組件

  設計區:開發組件地區

  連線管理員:當前SSIS包所用到的資料來源

  方案總管:可以查看資料來源和專案檔

  補充:整體風格和微軟的C/S頁面類似


4、建立SSIS包

SSIS所有的開發都是在包中完成的。

建立包步驟:在右側的方案總管中,右鍵SSIS包檔案夾,選擇建立SSIS包,這樣就可以開始ETL了


5、接下來就根據上面的題目來別建控制流程和資料流


6、雙擊資料流程工作進入資料流的設定


      現在對以上的資料流結合題目進行詳細的介紹:

    (1)OLE DB源是來源資料表的資料在題目中是employee_internet

    (2)尋找是根據來源資料尋找需要串連的表employee,並根據idCard進行串連

    (3)衍生的資料行是根據尋找無匹配輸出來將idType的身份證類型派生出一個不同的列

    (4)OLE DB目標將派生出的列及兩個表的資訊輸出到OLE DB目標employee

    (5)點擊執行就會看到成功,從資料庫裡尋找就會發現連個表的資訊合并完成

       通過以上的操作就完成了這個小執行個體哦!很簡單的,大家試試看!

三、特點

        1.SSIS不僅僅用來簡單的傳輸和轉換資料,還可以用來對建立Business Intelligence 平台的資料進行整合、轉移、擴充、過濾和修正。

        2.SSIS 不但具有很多內建的資料清理功能,而且還可以通過第三方控制項來擴充功能,可以使使用者通過Visual Studio.NET開發自訂的控制項。 

   3.SSIS可以將資料直接匯入到SQL Server 分析服務(Analysis Services) 的 Cube中。 

   4.SSIS可以與SQL Server 報表格服務 (Reporting Services) 無縫整合,即 SSIS 包可以作為報表格服務的資料來源。

四、總結

      以上就是對SSIS的簡單介紹,並根據一個小執行個體來進行講解,從而更好的理解!從這裡感受最深的就是,如果想更好的實現ETL的過程就必須對SQL語句有熟練的掌握,將SQL語句用圖形來展現出來,從而更方便快捷的構建目的資料來源。但是它也提供了編寫指令碼的方式來實現需要的功能,但是在後期很難維護,所以要謹慎用指令碼。

相關文章

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.