商業智慧也稱作BI,是英文單詞Business Intelligence的縮寫。商業智慧通常被理解為將企業中現有的資料轉化為知識,協助企業做出明智的業務經營決策的工具。這裡所談的資料包括來自企業業務系統的訂單、庫存、交易賬目、客戶和供應商等來自企業所處行業和競爭者的資料以及來自企業所處的其他外部環境中的各種資料。而商業智慧能夠輔助的業務經營決策,既可以是操作層的,也可以是戰術層和戰略層的決策。為了將資料轉化為知識,需要利用資料倉儲、線上分析處理(OLAP)工具和資料採礦等技術。因此,從技術層面上講,商業智慧不是什麼新技術,它只是資料倉儲、OLAP和資料採礦等技術的綜合運用。
商業智慧定義為下列軟體工具的集合:
終端使用者查詢和報告工具。專門用來支援初級使用者的未經處理資料訪問,不包括適應於專業人士的成品報告產生工具。
OLAP工具。提供多維資料管理環境,其典型的應用是對商業問題的建模與商業資料分析。OLAP也被稱為多維分析。
資料採礦(Data Mining)軟體。使用諸如神經網路、規則歸納等技術,用來探索資料之間的關係,做出基於資料的推斷。
資料倉儲(Data Warehouse)和資料集市(Data Mart)產品。包括資料轉換、管理和存取等方面的預配置軟體,通常還包括一些業務模型,如財務分析模型。
線上分析處理 (OLAP) 的概念最早是由關聯式資料庫之父E.F.Codd於1993年提出的,他同時提出了關於OLAP的12條準則。OLAP的提出引起了很大的反響,OLAP作為一類產品同聯機交易處理 (OLTP) 明顯區分開來。
當今的資料處理大致可以分成兩大類:聯機交易處理OLTP(On-Line Transaction Processing)、線上分析處理OLAP(On-Line Analytical Processing)。OLTP是傳統的關係型資料庫的主要應用,主要是基本的、日常的交易處理,例如銀行交易。OLAP是資料倉儲系統的主要應用,支援複雜的分析操作,側重決策支援,並且提供直觀易懂的查詢結果。
OLAP是使分析人員、管理員或執行人員能夠從多角度對資訊進行快速、一致、互動地存取,從而獲得對資料的更深入瞭解的一類軟體技術。OLAP的目標是滿足決策支援或者滿足在多維環境下特定的查詢和報表需求,它的技術核心是"維"這個概念。
“維”是人們觀察客觀世界的角度,是一種高層次的類型劃分。“維”一般包含著層次關係,這種層次關係有時會相當複雜。通過把一個實體的多項重要的屬性定義為多個維(dimension),使使用者能對不同維上的資料進行比較。因此OLAP也可以說是多維資料分析工具的集合。
OLAP的基本多維分析操作有切入(roll up和drill down)、切片(slice)和切塊(dice)、以及旋轉(pivot)、drill across、drill through等。
切入是改變維的層次,變換分析的粒度。它包括向上切入(roll up)和向下切入(drill down)。roll up是在某一維上將低層次的細節資料概括到高層次的摘要資料,或者減少維數;而drill down則相反,它從摘要資料深入到細節資料進行觀察或增加新維。
切片和切塊是在一部分維上選定值後,關心度量資料在剩餘維上的分布。如果剩餘的維只有兩個,則是切片;如果有三個,則是切塊。
旋轉是變換維的方向,即在表格中重新安排維的放置(例如行列互換)。
OLAP有多種實現方法,根據儲存資料的方式不同可以分為ROLAP、MOLAP、HOLAP。
ROLAP表示基於關聯式資料庫的OLAP實現(Relational OLAP)。以關聯式資料庫為核心,以關係型結構進行多維資料的表示和儲存。ROLAP將多維資料庫的多維度結構劃分為兩類表:一類是事實表,用來儲存資料和維關鍵字;另一類是維表,即對每個維至少使用一個表來存放維的層次、成員類別等維的描述資訊。維表和事實表通過主關鍵字和外關鍵字聯絡在一起,形成了“星型模式”。對於層次複雜的維,為避免冗餘資料佔用過大的儲存空間,可以使用多個表來描述,這種星型模式的擴充稱為“雪花模式”。
MOLAP表示基於多維資料群組織的OLAP實現(Multidimensional OLAP)。以多維資料群組織方式為核心,也就是說,MOLAP使用多維陣列儲存資料。多維資料在儲存中將形成“立方塊(Cube)”的結構,在MOLAP中對“立方塊”的“旋轉”、“切塊”、“切片”是產生多維資料報表的主要技術。
HOLAP表示基於混合資料群組織的OLAP實現(Hybrid OLAP)。如低層是關係型的,高層是多維矩陣型的。這種方式具有更好的靈活性。
還有其他的一些實現OLAP的方法,如提供一個專用的SQL Server,對某些儲存模式(如星型、雪片型)提供對SQL查詢的特殊支援。
OLAP工具是針對特定問題的聯機資料訪問與分析。它通過多維的方式對資料進行分析、查詢和報表。維是人們觀察資料的特定角度。例如,一個企業在考慮產品的銷售情況時,通常從時間、地區和產品的不同角度來深入觀察產品的銷售情況。這裡的時間、地區和產品就是維。而這些維的不同組合和所考察的度量指標構成的多維陣列則是OLAP分析的基礎,可形式化表示為(維1,維2,……,維n,度量指標),如(地區、時間、產品、銷售額)。多維分析是指對以多維形式組織起來的資料採取切片(Slice)、切塊(Dice)、切入(Drill-down和Roll-up)、旋轉(Pivot)等各種分析動作,以求剖析資料,使使用者能從多個角度、多側面地觀察資料庫中的資料,從而深入理解包含在資料中的資訊。
主流的商業智慧工具包括BO、COGNOS、BRIO。一些國內的軟體工具平台如KCOM(http://www.kcomsoft.com/)也整合了一些基本的商業智慧工具。
根據綜合性資料的組織方式的不同,目前常見的OLAP主要有基於多維資料庫的MOLAP及基於關聯式資料庫的ROLAP兩種。MOLAP是以多維的方式組織和儲存資料,ROLAP則利用現有的關聯式資料庫技術來類比多維資料。在資料倉儲應用中,OLAP應用一般是資料倉儲應用的前端工具,同時OLAP工具還可以同資料採礦工具、統計分析工具配合使用,增強決策分析功能。