商業智慧:籌劃您的首個 Microsoft BI 解決方案

來源:互聯網
上載者:User
文章目錄
  • 什麼是 BI?
  • 查詢您的公司資料庫時出現了什麼問題?
  • 針對決策制定的支援
  • 運行中的 BI
  • Microsoft BI 堆棧
  • 解決方案的開發方法
  • 入門
  • 後續步驟
商業智慧: 籌劃您的首個 Microsoft BI 解決方案

在本文中,我定義了 BI 並簡要描述了 BI 解決方案的進階體繫結構。我還講解了構建 BI 解決方案的過程。

Stacia Misner

大多數資料庫管理員 (DBA) 在管理其組織的資料和 Microsoft SQL Server 實現時都遇到了某種形式的商業智慧 (BI)。許多其他不具有
DBA 職責的 IT 專業人員可能聽說過 BI,但並未切身體驗過 BI,甚至完全不清楚什麼是 BI。在本文中,您將瞭解到究竟什麼是 BI。一旦您瞭解 BI
技術的真正用途以及如何在 Microsoft BI 平台上構造 BI 解決方案,您就會知道為什麼 BI 不僅僅適用於 DBA。如果您瞭解 BI,就能夠在您組織的
BI 計划出現(這些計劃將出現)時更好地支援這些計劃,並且您將瞭解如何使用 BI
來跟蹤和分析與您的角色相關的資料,從而使您的工作更加輕鬆,並加深對這些資料的理解。

本文是一系列介紹 Microsoft BI 堆棧的文章的第一篇。在這篇文章中,我定義了 BI 並簡要描述了 BI 解決方案的進階體繫結構。我還講解了構建
BI 解決方案的過程。若要深入瞭解本文中提到的 SQL Server BI 技術,您可以閱讀本期雜誌中由 Derek Comingore
編寫的隨附文章(請見“為 BI
解決方案構建資料基礎”)和下期雜誌中由 Scot Reagin 和我編寫的隨附文章。

什麼是 BI?

幾年前,在我和別人合著 Business Intelligence:Making Better Decisions
Faster
(《商業智慧:更快地做出更好的決策》,Microsoft Press,2002)時,我的同行就哪些技術應歸入 BI
的範疇並納入本書覆蓋範圍這個問題的意見很不統一,我對此十分驚訝。聽到 BI 專業人員就哪些工具是 BI 工具,哪些工具不是 BI
工具發表了不同的意見使我受到了啟發。IT 行業中仍存在著這樣的觀念差異,並且很多人還在繼續爭論 BI 的定義。在我看來,BI
既與商務程序有關,也與技術有關,因此我將從這個角度來開始定義 BI。

作為一個商務程序,BI
是您為收集和分析資料而執行的一系列活動,您可以通過與他人共用分析結果來做出更好的決策並增強您的業務。無論您是需要資訊以決定如何使日常工作更高效還是需要為長期規劃(如下一年的預算)提供支援,您用來尋找、傳輸、格式化和研究資料的步驟都是
BI 的一部分。此外,BI 還包括用於使結果可供日後參考的過程,這樣您和其他人便能夠在研究這些資料後估計您的決策所產生的影響。一般來說,BI
是一個迭代過程。您可以分析資料來瞭解發生的事情,可以採取措施來確保始終發生好的事情並避免發生壞的事情,然後可以分析資料來確定您的措施是讓事情變得更好還是更差了,以及外部因素是協助還是阻礙了您的工作。

由於 BI 具有如此廣泛的定義,您每天甚至在記下少量資訊或建立列表來協助您做出決策時也會用到
BI。通過將技術引入到您用來收集、分析和共用資訊的部分或所有商務程序中,可以讓這些流程更高效。在採用 BI
技術時,旨在從小處著手的組織通常會先使用該技術來解決特定問題。隨著時間的推移,組織會將重心轉變為在整個組織中發布資訊,從而使 BI
技術的使用範圍逐漸擴大。隨著其 BI 策略的日趨成熟,組織通常會獲得更複雜的工具,以便能更好地與資料進行互動並更深入地研究資料。

查詢您的公司資料庫時出現了什麼問題?

在 BI 的任何定義中,資料始終是重點。您可能想知道,在您只需查詢組織的一個或多個資料庫便能獲得所需資料時,為何還要費心建立 BI
解決方案?在以下情況下,您可能不需要正式的 BI
解決方案:您是您正在收集的資料的唯一使用者,您有訪問公司資料庫的工具、技能和安全許可權,您需要的所有資料都在這些源中。相比之下,如果您需要定期與技術技能和安全許可權有所不同的其他人共用資訊,則需要建立一個便於使用和維護的
BI 解決方案。您還需要考慮的是,當您的同事獲悉這個靈巧的 BI 解決方案後,他們也會想使用它。為了滿足這個預期需求,您的解決方案應一開始就是可擴充的。

從表面上看,允許公司內部的每個人通過運行報告來從企業資料庫擷取資料可能看起來是個好主意,但這個方法將不會在 DBA
中廣受歡迎。他們會告訴您,直接查詢企業資料庫可能會引發一些問題。以下是幾個更常見的問題:

  • 如果組織的資料以不同格式儲存在各個平台上,則將這些資料整合成一類對分析很有用的常見格式可能是一大難題。無法將資料從源表直接複製到常見目標表中,而必須在儲存資料之前以某種方式操作資料。
  • 資料定義在多個資料庫之間可能是不一致的,並且難以協調看起來類似的資料。例如,可以按照一組商務規則來計算銷售資料庫中的收益,但會受到總帳資料庫中的一組完全不同的商務規則的約束。
  • 可能已為每個資料庫建立了結構並進行了最佳化,以便插入資料或執行查詢。即使您只需要查詢一個資料庫,運行分析查詢通常也需要匯總大量資料,這是一項需要耗費大量資料庫資源的操作。因此,查詢的執行時間可能較長,並會與執行插入、更新或查詢操作的其他應用程式爭用資源。
  • 曆史資料通常在企業資料庫中存檔而不是無限期地維護。如果您需要查看隨時間變化的趨勢(一個常見的 BI
    活動),您的解決方案可能必須成為一個不在企業資料庫中儲存的資料的存放庫。
  • 企業資料庫可能沒有分析所需的某些資料。這些資料可能以一般檔案、試算表或非結構化資料格式(如 Microsoft Word
    文檔)的形式存在。擷取使用者儲存在其本機電腦或大腦中的資訊會更加棘手。
  • 即使資料可用,品質問題有時也意味著您無法從源直接使用它。您可能需要下載資料並對其進行清理,然後才能分析資料。除非可以在源中清理資料,否則每當您訪問資料時都需要手動清理它
    - 確保您每次都應用相同的規則。此外,您無法確保使用相同資料的其他人都會應用相同規則來清理資料。

為瞭解決與資料訪問相關的這些問題,BI
解決方案通常會包含一個為儲存用於分析的資料而專門建立的資料庫。擁有這樣一個資料庫就意味著您可以避免在產生資料的活動和使用資料的活動之間出現任何資源爭用問題。進一步來說,您可以重構資料,使摘要資料的查詢能更快地運行。當您需要合并不同資料來源中的資料時,您可以對這些資料進行集中管理,並應用商務邏輯以將這些資料設為含義一致的常見格式。您也可以將來自資料庫之外的其他源(如
XML
文檔或試算表)的資料合併到此中心位置。建立單獨的資料庫的另一個好處是,您可以在從來源資料庫中清除曆史資料後根據需要保留曆史資料。最後,您可以自動執行清理和增強資料的過程以便分析,從而確保每次訪問資料時都應用相同的規則。

針對決策制定的支援

BI 解決方案不應僅限於協助您更好地訪問資料,還應專門支援您的決策制定工作。一般而言,BI
解決方案應協助您評估並響應業務條件,無論您是需要有關整個組織的全面資料還是需要某個部門、工作群組或單人團隊的局部資料。實際上,從資料的匯總視圖快速移動到資料的詳細視圖這一能力是
BI 中的一項重要功能。

BI
解決方案旨在讓您將時間花在分析資料並尋求問題的答案上,而不是花在跟蹤、合并、重新格式化和協調資料本身上。當您有充足的時間來分析資料時,您通常可以儘早發現問題並採取措施來遏制消極趨勢。您還可以使用
BI
來發現看上去不相關的資料點之間的關聯,然後改變策略以詳細分析節省的資金或收益。您每天在工作時所做的每個決策(無論您是要解決問題還是要為將來做規劃)都會直接或間接地轉換為公司的成本或收益。

運行中的 BI

從理論上理解 BI 已經很好了,而查看運行中的 BI 可以真正協助您瞭解它的好處。為了向您說明 BI
的工作原理,本系列文章中的其他三篇文章描述了為一家名為 Adventure Works 的虛構公司開發 BI 解決方案的過程。在本文的結尾,我將說明如何擷取用於
Adventure Works 的樣本資料庫,Adventure Works
是一家虛構的單車製造商,其產品銷往世界各地。該公司的銷售人員負責將其產品批發給經銷商,如小型單車商店或大型倉儲式專營店。Adventure Works
也會通過 Internet 向個人客戶銷售產品。Adventure Works 資料提供了大量很適合 BI 解決方案的分析機會。

請記住,BI 解決方案旨在支援決策制定。明確這一點後,我們來看看 Adventure Works 在做出關鍵決策之前需要回答的幾類問題:

  • 哪一種銷售渠道創造的利潤更多?Adventure Works 必須決定是否聘用更多的銷售人員,以便與更多的經銷商建立關係或擴大其 Internet
    銷售業務。為了協助指導這個決策,分析人員必須能夠比較一段時間內經銷商和 Internet
    網站的銷售業績。分析人員需要比較的銷售業績資料點(稱為度量)包括銷售額、訂單數量和利潤率。利潤率的向好趨勢是最重要的度量,因為如果這些銷售導致了淨虧損,則即使銷售額(以美元或已售單元數為單位)很高,公司也不會實現盈利。
  • 對特定產品的需求是增加還是減少了?Adventure Works 必須使生產水平與銷售需求保持一致。如果對某些產品的需求增加了,Adventure
    Works 就必須調整其製造流程,以確保有更多的這類產品可供銷售,從而提高銷售業績。如果對其他產品的需求減少了,Adventure Works
    就必須降低產量或者停產,以免在供大於求的情況下進行虧本銷售。

即使您的工作不需要分析銷售資料,我仍鼓勵您在我們為 Adventure Works BI
構建解決方案時也跟著這樣做。您可以將本系列文章中所述的同一設計和開發原則應用到您自己的資料中。

Microsoft BI 堆棧

現在,讓我們進一步瞭解一下 BI 的技術體繫結構。Microsoft BI 堆棧為您提供了構建、管理和使用 BI 解決方案時所需的一切工具。SQL
Server 2008
是作為承載資料超市或資料倉儲的資料平台的堆棧的基礎。資料超市必須是特定於主題的資料存放區。資料倉儲是包含多個主題的資料的企業範圍內集合。資料超市和資料倉儲之間的界線比較模糊,但您不必擔心無法區分它們。在本系列文章中,我使用了術語“資料超市”。(雖然本系列文章涉及的是
SQL Server 2008,您還可以使用 SQL Server 2005 構建類似的 BI 解決方案,其 BI
組件與提供的說明相比經過了少量修改或未經任何修改。)

SQL Server 2008 包括三個 BI 組件:Integration Services (SSIS)、Analysis Services
(SSAS) 和 Reporting Services (SSRS)。這些組件分別利用Data Integration功能、多維資料庫支援和資料展示層來擴充資料平台。
1
說明了 BI 解決方案中各個組件之間的關係。

圖 1 BI 解決方案中的 SQL Server 2008 組件

在您設計資料超市的物理結構後,可以使用 SSIS 向其中填入從其他資料來源提取的資料。SSIS
提供了自動執行以下過程所必需的工具:清理資料、合并來自多個源的資料以及將資料轉換為適合分析的結構。您可以使用 SQL Server
代理來安排定期執行這些過程。Derek Comingore 在其有關 SSIS 的文章中的第 31 頁中,說明了如何為 BI 解決方案開發擷取、轉換和下載
(ETL) 過程。

通過將 SSAS 資料庫添加到您的 BI 解決方案,您可以支援更複雜且高效能的互動式查詢。可以使用 SSAS
將關係資料複製到名為Cube的多維資料庫結構中。設計完善的Cube可通過添加索引和摘要表的功能等效項(稱為“彙總”)來最佳化臨時查詢的資料以返回查詢結果,此查詢方法的速度相較於對關聯式資料庫執行的可比較查詢的速度將按指數方式增長。還可以將複雜的計算邏輯嵌入Cube中以簡化查詢,該查詢原本在使用關係資料來源時需要複製數百行
Transact-SQL 代碼。利用多個前端工具(稱為Cube瀏覽器),您無需編寫任何代碼即可查詢Cube。在下一期雜誌中,Scot Reagin
將向您介紹如何開發作為 BI 解決方案的一部分的Cube。

無論您是要將資料存放區到 SQL Server 資料超市還是 SSAS Cube中,都可以將 SSRS
添加到方案架構中以使資料對使用者可用。SSRS
是一個包含工具的報告平台,這些工具可用於開發報告,通過集中式管理基礎結構來保護和管理發行的報告以及支援使用者訪問報告。可以使用 SSRS Web 應用程式或
Microsoft Office SharePoint Server 2007 (MOSS)
來查看報告,可以使用訂閱功能來通過電子郵件接收報告,或調用您應用程式中的 SSRS Web 服務來顯示報告。報告的預設視圖將以 HTML
格式顯示,但您也可以將報告匯出到其他檔案類型,如 PDF 或 Excel。下個月,我將詳細說明如何在您的 BI 解決方案的資料展示層中使用 SSRS。

Microsoft BI 堆棧還包含幾項 Microsoft Office 技術,這些技術可增加針對資料展示層的選項數。對於支援 BI
解決方案中的資料分析,Excel 2007 是一個常見選擇。您可以訪問 SQL Server 資料超市或直接從 Excel 瀏覽 SSAS
Cube(如圖 2 中所示),並可以比在查看 SSRS 報告時更自由地瀏覽資料。

圖 2 使用 Excel 2007 瀏覽Cube

除了使用 Excel
來瀏覽關係資料和多維資料之外,還可以使用其資料採礦演算法從您的資料中找出隱藏的提示模式或檢測資料中的異常情況(這意味著您可以在填充資料超市之前糾正問題)。開始進行資料採礦的一個好方法是,從
Microsoft 下載一個免費的 Excel 附加元件,然後用它來分析從任何源匯入到 Excel 中的資料或查看在 SSAS
伺服器上建立和儲存的資料採礦模型的輸出。Visio 2007 的附加元件也可用於共用批註資料採礦模型。可以在“Office
2007 的資料採礦附加元件”中瞭解有關下載和使用這些附加元件的更多資訊。

對於共用資料,一個日趨流行的選擇是 MOSS 中提供的 Excel Services。通過使用 Excel 2007,您可以先建立一個活頁簿(其中包含將
SSAS Cube用作其資料來源的樞紐分析表),然後將資料連線和活頁簿發布到 Excel
Services。儘管您發行就緒包含來自其他類型資料來源的資料的活頁簿,但將 SSAS、樞紐分析表和 Excel Services
一起有很多好處,其中包括可以在保留了 Excel 的熟悉風格的純 HTML 介面中使用大部分相同的Cube瀏覽功能。另一個好處是,可以實現 Excel
活頁簿的集中管理和訪問。有關 Excel Services 的更多資訊,請參閱“Excel Services
技術概述”。

對Cube瀏覽使用 Excel Services 的另一個好處是,可以使用 Excel Web Access Web 組件將樞紐分析表和樞紐分析圖嵌入
MOSS 儀表板頁中。儀表板是一個特殊的 SharePoint 內容類型,它允許您使用各種 Web
組件在一個頁面上呈現來自多個源的資料。您甚至可以將一個篩選器添加到儀表板頁,並將該篩選器串連到部分或所有 Web
組件以便根據所選的篩選器動態更改頁面上的內容。圖 3 顯示了一個樣本 MOSS 儀表板。MOSS 還包括一個用來顯示儲存在
MOSS 伺服器上的 SSRS 報告的 Web 組件(一個稱作整合模式的可選 SSRS 配置),或者您可以使用 SSRS 附帶的 Web
組件來顯示儲存在報表服務器上的報告(稱作原生模式的預設配置)。

圖 3 使用 MOSS 儀表板頁顯示活頁簿和報告

對於具有更多功能的儀表板,可以使用 Microsoft Office PerformancePoint Server 2007 (PPS)。可以使用
PPS 來開發可部署到 MOSS 的計分卡和儀表板。計分卡是一個報表,它會將實際效能與定義的目標進行比較並用彩色編碼表徵圖顯示結果。可以使用特定類型的 Web
組件在標準 MOSS 儀表板中顯示 PPS 計分卡或將其顯示為 PPS 儀表板的一部分。在儀表板中,可以將 PPS
報告添加到儀表板地區來顯示同一資料的不同視圖(如圖 4 中所示)或顯示來自不同源的相關資料。

圖 4 使用 PPS 儀表板顯示資料

如您所見,儘管 Microsoft BI 堆棧提供了大量用於開發、管理和實現 BI 解決方案的選項,但它絕不會阻止您使用其他選項。Microsoft BI
堆棧從上到下都是一個可擴充的體繫結構,當您需要支援特定要求時,可以在其中插入自訂應用程式或第三方應用程式。

解決方案的開發方法

開始瞭解 Microsoft BI 堆棧的最好方法是構建一個簡單的解決方案。本系列文章中的隨附文章將向您介紹如何使用 SSIS、SSAS 和 SSRS
構建解決方案。在您讀完本系列文章後,您將大致瞭解所有這些組件的工作原理。但您並不一定要為構建的每個 BI 解決方案使用堆棧中的每個組件。

當您整理 BI 解決方案時,可能計劃將大多數時間花在執行資料準備任務(如重構和清理)上。在 BI 術語中,此組任務稱作擷取、轉換和下載 (ETL)
過程。

在您開始 ETL 開發之前,必須仔細規劃 BI 解決方案的設計。根據我的經驗,如果您有一個特定的業務問題要解決,並在設計時先考慮使用者與資訊互動的方式,則
BI
解決方案的開發會更加順利。通過採用以使用者為中心的方法,您可以反向執行適用的商務程序來設計能正確檢索和構造資料的解決方案以滿足業務需求。此建議可能看起來是一個顯而易見的方法,但我發現很多人都嘗試將解決方案開發從可用資料轉移給使用者,並最終採用從未用過的解決方案。

在您提出初始設計後,便可以開始進行開發了。如果 BI 解決方案使用 SSIS、SSAS 和 SSRS,則通過先使用 SSIS 建立和填充 BI
解決方案的資料結構來開始。一旦資料準備就緒,您就可以通過構建一個Cube來繼續下一步操作。當完成開發後,可以處理該Cube以在其中載入資料。然後,可以使用
SSRS
來開發用於查詢Cube的報告,並在報告中顯示查詢結果。在本系列文章的後三篇文章中,將向您介紹如何分步執行這一過程。對於您自己的項目,您應逐步反覆完成此過程,以確保每個步驟的結果都能滿足後續步驟的要求。

入門

若要完成本系列文章的剩餘文章中所述的完整 BI 解決方案,您需要安裝 SQL Server 2008,包括 SSIS、SSAS 和
SSRS。如果您能訪問網路上的 SQL Server、SSAS 伺服器和報表伺服器,則只需在您的電腦上安裝開發工具即可。有關產品安裝說明,請參閱“如何:安裝
SQL Server 2008(安裝程式)”。您可以從
CodePlex 下載用於為 Adventure Works 構建解決方案的樣本資料庫。第一個資料庫是
AdventureWorks2008,它是聯機交易處理 (OLTP)
資料庫的代表,用於捕獲由銷售部門、生產部門和人力資源部門中的業務操作產生的事務。您將此資料庫用作使用 SSIS 構建的資料超市的源。第二個資料庫是
AdventureWorksDW2008,它是表示資料倉儲設計中的最佳實務的資料樣本。如果您決定不瞭解 SSIS 並直接跳到Cube開發,則可以將此資料庫用作
SSAS Cube的源。

後續步驟

在您熟悉 SQL Server BI
組件後,您應找到所擁有的一個簡單項目以鞏固您的知識。您一開始不需要成熟的資料超市,而應嘗試使用本系列文章的下一篇文章中所述的原則來構造資料。一旦您開始使用
BI,您就可能永遠不會再用同樣的方法來查看資料了。

Stacia Misner 是一名 BI 顧問、教師和作者,同時也是 Data Inspirations
的創始人和負責人。她從事 IT 行業已有 25 年,其中有 9 年是在研究 Microsoft BI 堆棧。Stacia 已撰寫多部有關 BI 和 SQL
Server 的著作。她的最新著作 Microsoft SQL Server 2008 Reporting Services Step by
Step(《Microsoft SQL Server 2008 Reporting Services 循序漸進》,Microsoft
Press,2009)已於今年年初出版。您可以通過 smisner@datainspirations.com 與她聯絡。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.