由於需要記錄日益複雜的資料倉儲實現,導致美國Omaha公用電力分部的IT工 作人員不得不購買一套新的圖形化的資料建模工具,但要獲得母公司對該項目的 審批,幾乎是不可能的。
公用事業部門負責向內布拉斯加州的大部分地區 提供電力,他們決定從Embarcadero公司購買ER / Studio XE資料建模軟體。公司 商業智慧(BI)和資料倉儲架構師Bill Harrison表示,他設法獲得購買批准,通過 忽略技術方面的情況,保住底線,解釋採取行動的效果。
“真的很難,很 難得到批准,”Harrison說:“所以,我決定使營銷方式來推銷它,而不是使用 技術方式。”
在決定拋開談話的高科技話題之後,Harris來到Omaha電力 公司準備回答進階管理者提出的問題。這些問題包括:為什麼我們需要這個工具? 它能讓公司獲得什麼收益?什麼是投資回報?需要多長時間才能實現價值?如果我們 不採取行動,會發生什麼狀況?
資料模型——顯示資料來源和資料庫表彼此 之間的關聯,以及與資料倉儲的關聯,在Omaha電力其中一部分以Microsoft Excel試算表的形式記錄。但這些檔案是很難讓一般的企業工人理解。Harrison 努力讓公司明白,這種狀況最終會導致代價高昂的錯誤。
Harrison解釋說 ,電力公司的企業客戶越來越多地由自己來產生BI報表而無需IT人員的協助,需 要方便使用的資料建模文檔,來協助他們獲得正確的資訊、獲得正確的結果、做 出正確的決策。
“很多人曾試圖將此作為一個技術項目來推動,而我說, ‘這行不通,我們需要進行市場化運作。”他說。
資料建模軟體迅速產生 效果
Omaha電力公司的IT應用大多集中於Oracle PeopleSoft Financials and General Ledger(賬務和總賬管理系統),以及一個強大的處理超過30萬商業 客戶和家庭使用者資料的資訊系統。Harrison說,所有這些應用程式正不斷地產生 的資訊最終都要被清洗、去重,然後匯入到一個用於進行BI和分析報表的大型數 據倉庫中。該公司使用IBM Cognos BI報表軟體。
“客戶資訊系統擁有 15000張表和視圖,”Harrison說:“怎麼應付這些呢?”
Omaha電力使用 Embarcadero公司的軟體只有幾個月的時間,但Harrison表示,他對已經取得的效 果非常高興。該組織已經開始使用ER / Studio產生一些急需的資料倉儲文檔, Harrison預計隨著其他的應用程式即將上線,將很快使用該工具建立新的資料模 型。
Harrison透露,ER / Studio有兩種顯示資料模型的方式。首先是標 准報表格式,基本上使用文字來描述資料來源之間的關係。使用者還可以使用實體關 系圖(ERD)功能,其中顯示了豐富多彩的用圖形表示的資料來源,以及它們之間的相 互關係是怎樣。
“例如,ERD展現了我們的預算資料集市的架構。它顯示 表結構,以及它們是如何關聯起來的,”Harrison說:“你可以直接從工作區進 行瀏覽,也可以將其列印出來。”
Omaha還利用ER / Studio“逆向工程” 這一功能,將其資料倉儲的結構抽取出來。Harrison和他的團隊建立資料集市的 子模型,以便使用者更易理解。市場上其他的資料建模工具,包括CA Erwin、 Oracle SQL Developer Data Modeler和Quest公司的Toad Data Model。
站在“大資料”爆炸的邊緣
Omaha電力公司今天正在經曆的巨大挑戰之一 是:資料的日增長量空前上升,即所謂的“大資料”爆炸。隨著資料量增長的規 模和速度,正確地記錄資料模型和整體資料倉儲架構正變得比以往任何時候都更 為重要。
“大的變化正在發生,我們正面臨著大資料挑戰, 這僅僅是開 始,”Harrison說:“我們所談論的是數百TB甚至PB級的資料,隨著我們引入智 能電網和一些其他的技術,這將迫使我們來分析龐大的資料,在之前我們從來沒 有見過的資料量。”
智能電網和類似的技術方案,允許工具程式追蹤有關 消費者的高精度資訊,例如在一個給定的時間內咖啡壺或其他電器消耗了多少電 力。
“我們需要新的工具和技術去檢索這類資料,因為第一,它是非結構 化的;第二,資料量巨大,”Harrison說:“你可能還沒有記錄每一個項目,但至 少應該有一個資料模型對整體架構進行描述。”