網站資料分析的一些問題2

來源:互聯網
上載者:User

仲介交易 SEO診斷淘寶客 站長團購 雲主機 技術大廳

  

上一篇——網站資料分析的一些問題1中主要羅列了一些關於網站資料分析行業與資料分析師這個職業相關的一些問題,這篇是第二篇,主要想羅列一些關於BI的問題。

BI(Business Intelligence,商業智慧),先看一下維琪百科上面對BI的定義:

Business intelligence (BI) is defined as the ability for an organization to take all its capabilities and convert them int o knowledge.

BI提供大量有價值的資訊引導企業尋找新的發展機遇,當企業認識到潛在的機遇並成功地實施相應戰略決策的時候,BI就能説明企業在市場建立競爭優勢並維持企業持續地發展。 BI時常跟決策支援系統(Decision Support System, DSS)聯繫在一起,其實BI最主要的目標就是實現對企業的決策支援。

下面就探討幾個BI方面的問題:

Q1、BI與資料倉儲(DW)之間的關係是怎麼樣的? (知乎)

首先可以明確的是BI的重點在於對資料的應用上,讓資料變成有價值的資訊,而所有的基礎資料基本都是來源於資料倉儲。

BI有兩個方向的定義:廣義的BI是包含資料倉儲的,廣義的BI包括資料的獲取、處理、儲存,到之後的分析、挖掘、展現變成有價值資訊的整個過程,組成了一套完整的系統, 當然在這個系統中資料倉儲擔當著從資料獲取之後的處理和存儲的職責,是基礎組成部分;狹義的BI僅僅包括上層的資料應用,包括資料的展現、分析、挖掘等,所以不包括資料倉儲。

因為BI的定義更側重于資料應用,而隨著資料量的不大擴大,資料倉儲更多地被作為一項獨立的技術被抽離出來,所以當前BI和資料倉儲的定義更傾向于分離,整個系統被叫做「DW/BI」的解決方案。

Q2、BI系統主要是為了説明企業解決什麼樣的問題? (知乎)

BI最初的目標就是優化企業的決策支援,實現從資料到有價值的資訊的轉化,輔助企業商業戰略和決策的制定。 所以BI的最終目標是獲取商業的Insight。

BI首先實現的是企業資料的透明化,原始的資料包表就是為了從資料的角度定量地掌握企業的運營狀態,有了資料的支撐,很多決策的制定就會有了參考依據。 隨著商業和資訊技術的不斷發展,BI不再僅僅停留在報表的領域,資料除了展現以外被更多地用於商業分析,而商業分析的基礎組成就是統計、預測和優化,這些對企業的運營決策起到了更加關鍵的作用。 但隨著資訊膨脹,資料量的劇增,BI也不斷面臨挑戰,我們需要花更多的成本去處理和存儲資料,需要花更多的精力去分析和應用資料。 我之前寫過BI應用中的三大矛盾這篇文章,因為有段時間了,很多地方的看法可能有了變化,但這3個矛盾相信依然還是存在。

所以,最終還是要把握BI的輸出是有價值的資訊,無論中間的處理方式是查詢、報表,還是分析、挖掘,最終要得出的是有價值的結論。

Q3、目前BI的應用或元件主要有哪些? (知乎)

這裡簡單地歸納了一下,可能會有遺漏,希望大家能夠在評論中補充。 這裡僅僅包括狹義BI中基於資料應用層面的一些功能,資料倉儲的資料處理方面的應用不在這裡羅列。

首先是報表、圖表和Dashboard,目前的報表和圖表除了更加豐富以外,跟傳統報表還有一個關鍵的區別就是可交互性。 目前的報表基本都提供簡單的資料篩選、排序等功能,Dashboard的出現實現了按需整合報表和圖表的功能。

再則是OLAP,OLAP一度被當做BI的核心功能,不得不承認OLAP是分析資料最有效的手段,尤其是基於多個維度多個層面的分析,這些是一兩張報表圖表所無法做到的。 OLAP一般都是基於已經設計成型的多維模型以及存放多維模型的資料集市(Data Mart),資料集市和OLAP跟業務層面有著很多關聯,這個使資料集市跟底層的資料倉儲有了區分。

然後是資料的查詢和分析,有時基於既定的模型的OLAP無法滿足分析的需求,所以就有了資料查詢的需求,一般直接查詢資料倉儲的細節資料; BI中的Ad-hoc Query則是對既定多維模型的靈活查詢,可以自由組合維度和度量。

最後是報表的發佈和資料預警,這都是屬於BI平臺的推送功能,一般可以通過郵件訂閱的形式定期把組合的報表推送給相關的人員,而通過預警的設定,可以監控資料的變化趨勢,掌握資料可能出現的異常。

另外BI還有很多新奇的功能,如基於GIS的地圖資料、基於Flash實現的動態圖表及對資料採礦功能的集成等。

Q4、BI中的多維資料模型和OLAP的實用價值在哪? (知乎)

之前有關于多維資料模型和OLAP的介紹,可以參考資料倉庫的多維資料模型和資料立方體與OLAP這兩篇文章中的內容。

其實多維資料模型和OLAP最主要的是解決了如何有效地觀察資料的問題,傳統關係模型很難直接對資料進行觀察分析,而多維模型為數據觀察者提供了清晰的視角,就如平常我們從多個角度看待事物一樣, 多維模型維度的設計就很好地提供了這些角度的選擇。 而OLAP的幾個操作形式正是體現了「分析」這個詞本身的含義,從總體到細節,結合多個維度的交叉分析,讓我們具備了對整個資料集進行全景觀測的能力。

OLAP最關鍵的技術除了多維模型設計還有就是預計算(Precomputation),或者叫預聚合,預計算解決了資料快速獲取的問題,基於一定的規則或者演算法對資料集進行預計算之後,OLAP的操作性能可能得到有效地提升, 從而使對大量資料的快速靈活的分析操作成為可能。

Q5、目前市場上主流的BI產品主要有哪些? (知乎)

市場上主要的商業BI產品包括IBM的Cognos,另外IBM有自己的DB2可以建立資料倉儲,在2010年收購SPSS之後,讓其在資料分析和資料採礦的領域也更加具有競爭力、SAP的Business Objects(BO), 另外SAP有BW(Business Information Warehouse),作為傳統的ERP方案供應商在資料整合方面有獨特的優勢、Oracle的BI(企業級的叫BIEE,Oracle Business Intelligence Enterprise Edition),Oracle借助其強大的關聯式資料庫建立資料倉儲有獨特的優勢。 這3大商業BI都屬於整合型的BI,再加上微軟借助Sql Server資料庫提供的SSIS、SSAS和SSRS也是屬於整合型的BI解決方案。 另外也有獨立的BI公司,如SAS,傳統優勢在資料採礦領域、Micro Strategy的BI解決方案、開源強大的BI系統Pentaho(之前幾年還有很多開源的BI系統,但因為BI在技術上有一定的門檻和成本, 所以目前很多開源BI 都會包括開源版本和商業版本,Pentaho也不例外),國內也有用友的BQ軟體也是屬於BI產品。

歸納一下就是目前的BI產品主要以商業產品為主,而且整套的BI產品一般都是重量級的,在購買、部署和使用上都需要一定的成本投入。

如果對BI方面有自己的見解,歡迎在下面評論,或者到知乎回答相應的問題。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.