BI—SSIS初步認識,BI—SSIS認識
在上一篇中簡單的介紹了BI的整體架構,在接下來的幾篇就是針對某個知識點簡單講解。首先我們就進入SSIS的學習。
一、是什嗎?
SSIS(SQL Server Integration Service)是微軟的一個智能解決方案,通俗點和ASP.NET程式差不多,它也設計了很多的類似控制項的東西,不過叫任務,這些任務的主要功能是將資料從資料來源轉到資料目的,中間也會有查詢,彙總等等更加具體的任務。
二、怎麼用?
那麼SSIS是一個智能的解決方案,怎麼使用呢?接下來就根據執行個體進行詳細的說明:
題幹:兩張表結構
解釋:
(1)employee(員工表):店面員工資訊
employee:id(主鍵 自增)name(員工姓名)birthday(出生日期)idCard(證件號碼)idType(證件類型 1為身份證) empNo為員工編號
(2)employee_internet(網路員工表):網路員工資訊
employee_internet:id(主鍵 自增)name(員工姓名)birthday(出生日期)idCard(證件號碼)idType(證件類型 為中文身份證) empNo為員工編號
ETL過程:請將employee_internet表資訊根據idCard(證件號碼)合并到employee表中
解決方案的過程:
分析:
首先根據題幹得到根據idCard合并兩個表,但是兩個表中idType的類型不一樣,這就是問題的關鍵,所以先根據證件類型不同派生出另一個欄位,然後進行合并
過程:
1、建立SSIS專案檔
(1)在開始菜單中,找到SQL資料庫檔案下的SQL Server BusinessIntelligence Development Studio程式,單擊運行程式。
(2)在開啟的頁面中,點擊左上方的“檔案→建立→項目”,在”商業智慧”項目目錄下選擇”IntegrationService”項目,填入名稱和位置,點擊確定。
2、開啟現有的SSIS專案檔
找到需要開啟SSIS項目的檔案夾,開啟檔案。找到檔案尾碼名為.sln的檔案,並運行該檔案
3、頁面介紹
功能表列、工具箱、設計區、連線管理員、方案總管等
功能表列:所有的菜單選項
工具箱:所有的組件
設計區:開發組件地區
連線管理員:當前SSIS包所用到的資料來源
方案總管:可以查看資料來源和專案檔
補充:整體風格和微軟的C/S頁面類似
4、建立SSIS包
SSIS所有的開發都是在包中完成的。
建立包步驟:在右側的方案總管中,右鍵SSIS包檔案夾,選擇建立SSIS包,這樣就可以開始ETL了
5、接下來就根據上面的題目來別建控制流程和資料流
6、雙擊資料流程工作進入資料流的設定
現在對以上的資料流結合題目進行詳細的介紹:
(1)OLE DB源是來源資料表的資料在題目中是employee_internet
(2)尋找是根據來源資料尋找需要串連的表employee,並根據idCard進行串連
(3)衍生的資料行是根據尋找無匹配輸出來將idType的身份證類型派生出一個不同的列
(4)OLE DB目標將派生出的列及兩個表的資訊輸出到OLE DB目標employee
(5)點擊執行就會看到成功,從資料庫裡尋找就會發現連個表的資訊合并完成
通過以上的操作就完成了這個小執行個體哦!很簡單的,大家試試看!
三、特點
1.SSIS不僅僅用來簡單的傳輸和轉換資料,還可以用來對建立Business Intelligence 平台的資料進行整合、轉移、擴充、過濾和修正。
2.SSIS 不但具有很多內建的資料清理功能,而且還可以通過第三方控制項來擴充功能,可以使使用者通過Visual Studio.NET開發自訂的控制項。
3.SSIS可以將資料直接匯入到SQL Server 分析服務(Analysis Services) 的 Cube中。
4.SSIS可以與SQL Server 報表格服務 (Reporting Services) 無縫整合,即 SSIS 包可以作為報表格服務的資料來源。
四、總結
以上就是對SSIS的簡單介紹,並根據一個小執行個體來進行講解,從而更好的理解!從這裡感受最深的就是,如果想更好的實現ETL的過程就必須對SQL語句有熟練的掌握,將SQL語句用圖形來展現出來,從而更方便快捷的構建目的資料來源。但是它也提供了編寫指令碼的方式來實現需要的功能,但是在後期很難維護,所以要謹慎用指令碼。