標籤:
大資料的出現使業務智能真正地走入了21世紀。但事實上“大資料”詞代表的並不是解決方案,而是一類問題。在這些PB數量級的資料中,隱藏著怎樣的價值?我們從中能得什麼,並且使之指導業務部署的方方面面。但這一巨大量資料實際上有用的沒有多少。所以為了利用其隱藏的價值,企業需要收集、過濾,並通過情感分析應用、定位工具以及其它的技術來分析它,從中產生有用的資訊,從而為今後的業務發展服務。
雲可作為大資料分析的使能器
Forrester定義大資料為“在大規模的經濟性下,擷取資料的技術和技能。”這裡最關鍵的一個詞是經濟。如果提取、處理和利用資料的成本超過了資料價值本身,那麼這項工作就是沒意義的。幸運的是隨著資料量的不斷增長,技術也在不斷地進化,可協助大部分企業利用這些資料。雲技術,無論是公用雲端、私人雲端還是混合雲,在讓企業從大資料分析中提取潛在的ROI方面,都是不可或缺的一部分。
收集並過慮
前面已經提到巨大量的資料中可用的部分很少,但還是有BI產品大量的資料需要過慮,以後關聯並儲存其有用性。對大量儲存著臨時資訊的基礎設施投資的利益幾乎沒有,因為這一臨時資料大部分都會被丟棄。另外從公司防火牆外部移到內部的網路的資料也不會獲得什麼有價值的資訊,而且處理它也是使用IT經理頭疼的一件事。
這一階段的大資料過濾是一個完美的公用雲端平台應用,它可以提供按需擴充的計算和儲存資源。
分析
一旦資料轉化為可用的形式,那麼就進入到分析產生資訊的階段。從長遠來看,提供給分析應用的未經處理資料沒有必要一下保留,需要有效儲存是分析處理的結果。公用雲端和混合雲技術可用在分析階段,在資料集處理階段可引入Hadoop或類似替代方案。在公用雲端使用者的情況下,原始分析階段可以在公用雲端基礎設施上執行,然後使用私人雲端組件把處理過的、可用的資訊拿到公司內部。
虛擬化、整合和協作
在這一階段,我們實際上已經擁有了可用的資訊,可以用來指導決策。這還沒有結束,還要使這些資訊可為使用者使用,轉化並住處到現有的系統中,如企業資源規劃和客戶資源管理應用。軟體即服務應用運行在雲中,利用稍早階段開發的資料,來強化整合,讓使用者相互協作。
有了雲端運算技術,大資料的價值才能得到更好的轉化。不得不說,對於在使資料轉化為商用方面,雲是一個相當完美的平台。
當大資料分析與雲技術雙劍合璧