大資料正在改變許多公司和IT部門觀察、存儲和讀取資料的方式。 不過這個技術目前仍處在萌芽期中,而許多企業仍在尋找合適的平衡點。
隨著成功的公司挖掘它們的資料以獲得資訊,讓一系列看起來亂數字的資訊變成利潤增長點,大資料以及管理大資料的能力已經成為幾乎每個行業的核心競爭力。
不過,「大資料」的真正含義是什麼?是某種猜謎之類的東西嗎?簡單地說,大資料就是——公司範圍內產生並進入公司的所有資料。 大資料在不斷增加中。
IBM是這個新興領域的領導廠商之一。 它估計每天各種來源總共會產生2.5*109位元組的資料,包括感應器、社交媒體以及全球數以十億計的行動裝置。 這讓企業很難掌握和分析資料以提高競爭力、效率和獲利率。
IDC估計大資料技術和服務的市場將以每年接近40%的速度增長,到2015年達到169億美元規模。
此外,每個月人們要發送10億條Tweet,在Facebook上貼出300億條消息。 同時,現在有超過1萬億台行動裝置在使用中,而移動商務預計將在2016年達到310億美元的規模。
大資料和資料分析並肩前進。 資料分析是發現和溝通資料中有用的模式。 資料分析最常見的用途之一就是挖掘商業資料以便描述、預測和改善業績。
資料分析的一些特定領域包括企業決策管理、零售分析、市場行銷和網頁分析、預測性科學、信用風險分析以及欺詐分析。 零售、行銷和客戶管理已經成為領導廠商的關鍵業務點。 例如,IBM和Adobe已經在行銷分析上進行了大量的投資。 該領域的另一家領導廠商SAS關注于所有類型的分析,包括預測性分析。
不過,這個領域對於新來者來說還是開放的。 像Quant5這樣的初始公司正在進入這個市場,帶來它們自己品牌的分析解決方案和服務。
Andrew Brust是一位大資料專家、分析師和諮詢師。 他在紐約市創立了Blue Badge Insights。 他表示:「在大資料領域中前進得最靠前的行業包括網頁/互聯網、金融服務、零售,各行各業的一些製造和行銷部門。 網頁/互聯網、零售和行銷分析的是Weblog和社交媒體資料,用於判斷客戶的流覽和購買模式以及觀感。 金融服務分析的是市場資料,用於交易策略和金融產品設計。 製造業公司使用的是所謂的‘歷史’資料來監視流水線設備並開發預測模型來判斷什麼時候這些設備可能會發生故障。 」
United Healthcare(UHC)的科學、解決方案和戰略總監Mark Pitts告訴eWEEK說該公司在各種用途上流量分析工具來服務于它的數百萬客戶,包括季度預測、詐騙預防以及客戶服務機會。 此外,他的團隊使用SAS High-Performance Analytics平臺來分析大規模並行環境中更多的資料。 因此,Pitts表示他的團隊能夠將過去需要4個小時的流程縮短到只需要10秒鐘。
大資料正在改變許多公司和IT部門觀察、存儲和讀取資料的方式。 不過這個技術目前仍處在萌芽期中,而許多企業仍在尋找合適的平衡點。
Pitts表示:「我的團隊幾乎獨佔性地使用SAS產品。 」他指出他從1985年就開始SAS程式設計。 「通過SAS,我們能夠在任何商業問題發生的時候快速地做出反應。 現在的世界和我開始這項事業的時候很不同。 我以前是在大型機上進行SAS程式設計,當時我們的資料來源非常有限。 現在,各種來源的資料在爆炸式增長——一些來源甚至我們都沒看到,比如來自個人醫療設備的遙測資料。 」
SAS最近宣佈它的SAS High-Performance Analytics Server(SAS高性能分析伺服器)現在支援更多的分析手段,包括文本挖掘和優化。 SAS High-Performance Analytics Server的預測建模現在還使用Hadoop Distributed File System(HDFS:Hadoop分散式檔案系統),一種流行的開源大資料架構。
Macys.com行銷分析副總裁Kerem Tomak表示:「Macy.com的分析團隊在大資料平臺上選擇了Hadoop,而SAS是我們的分析引擎。 我們將這兩個環境聯繫起來以創建一個能夠推動商業價值的分析解決方案。 」
(責任編輯:蒙遺善)