資料倉儲解決方案指南

來源:互聯網
上載者:User
解決|資料 作者:Sybase軟體(北京)有限公司 市場部副總監 夏紅


內容:資料倉儲概念,Sybase的資料倉儲解決方案



--------------------------------------------------------------------------------


資料倉儲的概念


任何一個公司和企業,在訂貨、存貨清單、票據清單、帳目清算、客戶服務以及

財務報告等方面都存在大量的業務應用和技術環節。資料倉儲的作用在於:從這

些應用系統中擷取資訊並轉換到一個新的資料庫,通過對新庫中的曆史資訊和面

向主題的資訊進行分析,為決策提供支援。以往的產品系統,如訂貨或購置系統,

則很難從中獲得有關商業發展狀況的資訊。


資料倉儲是企業決策支援的一部分。在做出下一個決定前,每個商業機構中的行

政人員和分析人員都需要將許多關鍵商業問題搞清楚,例如:哪些產品最有利可

圖?哪些客戶會為我們帶來最大利益?哪些環節需要花費很高的費用?哪些行銷活動

運行得最好,為什麼?我們有可能會失去哪些客戶,為什麼?
這些都是資料倉儲要

回答的“百萬利潤”問題,也同時是一個最大的市場。據 Gartner估計,60%
的關

係數據庫管理系統被用作決策支援系統的應用開發。


資料倉儲與資料集市的比較


在二十世紀八十年代中期,Bill Inmon首次提出“資料倉儲”這一名詞。它最初被

設計為一個商務資料庫, 具有穩定性(主要成分不變)、曆史性(包含曆史資訊)和面

向主題(資訊由客戶、產品和市場等組成)等特點。這些最初的“資料倉儲”根據

對客戶、產品、銷售情況和財務狀況等資訊的分析,得到對企業活動的整體認識。


要建立一個資料倉儲,一般分為四個步驟:


第一步:資料庫設計,即設計出一個包含商業資料和資訊的資料庫,為商業實體

所用;


第二步:開發資料幫浦和轉換程式,從產品系統中將資料取出後放入資料倉儲中;


第三步:開發資料載入和更新技術,使得在產品資料發生變化時,資料倉儲得到

動態即時的更新;


第四步:購置查詢和報表產生工具,令使用者通過企業內部網和個人電腦很方

便地擷取資訊。


多年以來客戶發現:儘管企業級資料倉儲很有吸引力,但是具體操作起來有些難

度。1996年“IDC研究”調查結果表明:儘管為建立資料倉儲平均投入了三年多

時間和近320萬美元,50%沒有達到應有的效果。從項目開始算起,三年後,大多

數商人發現所面臨的商業問題已經不再是開始建立時的樣子,發生了很大變化。

另外,儘管開發進度被延長了一年又一年,仍然做不到讓所有感興趣的客戶對想

看到什麼資訊給出明確的需求定義。因而“企業資料模型”的確立如同練習一樣

進行了一年又一年。


在最近的18-24個月的時間裡,出現了一種新的解決辦法,那就是資料集市。資料

集市也是一種資料倉儲,只是它更精練,更面向主題。Sybase公司自創立以來,

便確立了在資料集市技術上的領導地位。目前,使用Sybase產品的2萬多家客戶中

的大多數已經建立了運行在SQL Server上的資料集市,儘管通常也稱為資料倉儲,

卻幾乎沒有一個是企業級的。


資料集市的優勢在於建設周期的縮短和費用上的大大降低。其中周期以月代替了年,

費用從幾百萬下降到一百萬。由於整個企業的資料很龐大,真正將它們集中到一個

資料庫中幾乎是不可能的。有人便對很多大資料倉儲實質上是不是資料集市產生了

懷疑。使用資料集市後。設計、抽取、轉換、載入和查詢等環節變得更加簡單,因

為客戶中的一部分人能夠更精確地知道他們自己所需要的資訊是什麼。


然而,如果有很多的資料集市卻不能使它們保持同步,資料集市解決方案就會遇到

困難。一旦一個單位建立了兩個或兩個以上的資料集市,最大的問題就是如何使它

們之間協調一致,如何使它們即時操作,以及如何維護所有的資料幫浦和轉換。另

外,當一個單位要建立兩個或兩個以上的資料集市時,會發現每一個都要經過一個

重新的設計、抽取、載入和查詢步驟。於是,在面對多個資料集市的開發時,如何

共用設計和結構成為一個有現實意義和挑戰性的問題。


運作型資料存放區與合并式資料倉儲


針對上述問題,一種解決方案是採用一種全新的資料倉儲概念 ---“運作型資料存

儲 (Operational Data Store,ODS)”。在ODS方式下,資料被從業務資料庫中複製到

一個中心位置,再從這裡被抽取到多個資料集市中。ODS是從客戶、產品和其他商

業角度來組織的,被稱為商業狀況的“即時快照”。它不包含曆史資訊,但可以很

容易地滿足一個曆史資料庫或一組面向主題的資料集市的需要。


我們一般稱之為“合并式資料倉儲”,因為它在進入決策支援資料庫以前是一個信

息的結合點。ODS雖小,卻能被經常地修改,因而非常適合於建立在Adaptive
Server

Enterprise 和 Replication Server上。



多維或OLAP(線上分析處理)市場


作為資料倉儲應用環節中的一部分,在市場份額上得到快速增長,變得越來越大。

簡單來說,OLAP是從商業角度進行資訊組織,而不象通常的由行、列和表構成。

例如,在一個類似 Arbor 或 Oracle Express 的 OLAP資料中,資訊是通過客戶、產

品、日期、銷售部門和地區等屬性來存取的,這對於資料理解和資訊擷取來說都

顯得非常直觀。


OLAP產品取得關係資料後,將它放入一個非常簡單的表格中,使之很容易分析。

資料庫和一個OLAP產品可被看做一個多維表格。這個市場相當熱門,Arbor、

Oracle的 Express 和 Microstrategy 在此領域中各佔一席之地,而 Sybase的
Power

Dimentions (原名whitelight),Cognos的 Impromptu 和 Powerplay,Brio Technology 的

BrioQuery處於優勢地位。


競爭者與夥伴一覽


RDBMS公司:Sybase,Oracle,IBM,Teradata/NCR,Informix,Microsoft


硬體公司:IBM,Teradata,Sun,Digital/Compaq,HP


轉換工具:VMARK,Infomatica,Carleton/Apertus,ETZ,Prism Solutions


OLAP:Sybase/PowerDimentions,Arbor,Oracle/Express,Microstrategy,

Information Advantage。


Sybase 的解決方案及其組成


Sybase擁有一個獨特而強有力的點對點方案,用來設計、建立和管理資料倉儲和數

據集市。各個部門之間通過集中的中繼資料進行互動,這便具有了完整性、集中性和

靈活性等特點。我們的工具也具有很多優越效能。


下表列出了各個組成部分:


(1)PowerDesigner Warehouse Architect


PowerDesigner不但是業界知名的資料庫設計工具,也是資料倉儲模型設計工具。其

中的 Warehouse Architect模組支援多種資料倉儲模型,包括星型模式、雪花模式、以


及雪暴模式。這是同行業中最優秀、最靈活的開發工具,可用來設計一個關係的或

OLAP的軟體倉庫。PowerDesigner在資料倉儲設計工具市場中佔有最大份額。它能從

已有的資料庫進行反向工程,從運行系統中將現存的資料結構抽取出來形成資料模

型,使設計變得簡單。



(2) PowerStage


強大的資料幫浦和資料轉換產品。它是領導市場的客戶/伺服器轉換方法,使資料倉


庫模型用PowerDesigner實現起來更加容易,更加直觀。PowerStage真正是安全並基於


引擎的。它有一個簡單的面向處理的圖形使用者介面,使得使用者可以快速啟動,重複


利用以往的



相關文章

E-Commerce Solutions

Leverage the same tools powering the Alibaba Ecosystem

Learn more >

Apsara Conference 2019

The Rise of Data Intelligence, September 25th - 27th, Hangzhou, China

Learn more >

Alibaba Cloud Free Trial

Learn and experience the power of Alibaba Cloud with a free trial worth $300-1200 USD

Learn more >

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。