大資料的應用前景之廣大已經毋庸置疑。 企業CEO、CIO在討論商業策略、IT模式創新時幾乎言必談大資料。 Gartner發佈的《Big Data Drives Rapid Changes in Infrastructure and 2 Billion in IT Spending Through 2016》(《大資料驅動基礎架構的快速變化,2016 年相關IT支出將達2320億美元》)報告指出,2013年大資料帶動的IT支出有望達到340億美元;到2016年,全球在大資料方面的總支出將達到2320億美元。 Gartner強調,大資料分析工具在2014年將被視為一種必要投資。
本文作者:甲骨文公司副總裁兼大中華區技術總經理 喻思成
如何充分利用大資料,挖掘大資料的商業價值,從而提升企業的競爭力,已經成為企業關注的一個焦點。 這也是甲骨文公司努力的方向。
全面解決方案才能奏效
當前,越來越多企業將大資料的分析結果作為其判斷未來發展的依據。 同時,傳統的商業預測邏輯正日益被新的大資料預測所取代。 但是,我們要謹慎管理大家對大資料的期望值,因為海量資料只有在得到有效治理的前提下才能進一步發展其業務價值。
最廣為人知的大資料定義是Gartner給出的大資料的3V特性:巨大的資料量(Volume)、資料的快速處理(Velocity)、多變的資料結構和類型(Variety)。 根據這一定義,大家首先想到的是IT系統中一直難以處理卻又不容忽視的非結構化資料。 也就是說,大資料不僅要處理好交易型資料的分析,還把社交媒體、電子商務、決策支援等資訊都融入進來。 現在,分散式處理技術Hadoop和NoSQL已經能對非結構化資料進行存儲、處理、分析和挖掘,但未能為滿足客戶的大資料需求提供一個全面的解決方案。
事實上,普遍意義上的大資料範圍更加廣泛,任何涉及海量資料及多資料來源的複雜計算,均屬大資料範疇,而不僅局限于非結構化資料。 因此,諸如電信運營商所擁有的巨量使用者的各類詳細資料、手機開關機資訊、手機在網註冊資訊、手機通話計費資訊、手機上網詳細日誌資訊、使用者漫遊資訊、使用者訂閱服務資訊和使用者基礎服務資訊等,均可劃歸為大資料。
與幾年前興起的雲計算相比,大資料實現其業務價值所要走的路或許更為長遠。 但是企業使用者已經迫不及待,越來越多企業高層傾向于將大資料分析結果作為其商業決策的重要依據。 在這種背景下,我們必須找到一種全面的大資料解決方案,不僅要解決非結構化資料的處理問題,還要將功能擴展到海量資料的存儲、大資料的分散式採集和交換、海量資料的即時快速訪問、統計分析與挖掘和商務智慧分析等。
典型的大資料解決方案應該是具有多種能力的平臺化解決方案,這些能力包括結構化資料的存儲、計算、分析和挖掘,多結構化資料的存儲、加工和處理,以及大資料的商務智慧分析。 這種解決方案在技術應具有以下四個特性:軟硬集成化的大資料處理、全結構化資料處理的能力、大規模記憶體計算的能力、超高網路速度的訪問。
(責任編輯:fumingli)