1.瞭解大資料
大資料分析起源于大型網路服務提供者,如谷歌、雅虎、Twitter,他們不僅僅需要使用者產生的資料,也想以此來保持企業的競爭力。
你的公司或許是一個很小的公司,也會有許多資料。 GigaOm research主任Jo Maitland表示,諮詢公司麥肯錫公司公司在近期的一份報告中指出,在接下來的幾年裡,許多行業,包括醫療、公共部門、零售業、製造業都將從大資料分析中獲益。
收集和分析交易資料可以讓組織更深入瞭解顧客的喜好。 它可以用來更好地瞭解創造新的產品和服務,並更容易應對緊急狀況。
2.有用的資訊可能出現在任何地方
Hortonworks CTO Baldeschwieler表示,你現在或許並不贊同大資料,但你將認可它,大資料使用的是你此前棄之不用的資料。
大資料可以是你的伺服器的日誌檔,例如。 伺服器跟蹤每位訪客訪問的網站和網頁的,和他們的位址,跟蹤這些資料你可以找出使用者的喜好。 訪客的登陸資料並不新奇,但卻可以從中找出新的資訊。
3.大資料適合的人才缺乏
當企業建立了一套大資料分析系統,但相應HTTP://www.aliyun.com/zixun/aggregation/14294.html">的大資料人才卻很缺乏。 Forrester Research分析師James Kobielus表示,大資料依靠堅實的資料建模,側重于資料科學,這可能需要統計模型、文本挖掘、情感分析,這不同于現在普通的分析師所具備的技能。
大資料人才可能供不應求,麥肯錫公司預計,2018年底,美國就可能面臨短缺140000至190000深度分析人才以及1500000個經理和大資料分析師。
此外,企業需要有能力存儲和處理大量資料,管理100台伺服器是完全不同于管理10台伺服器,因此需要聘請超級管理員。
4.大資料不需要事先組織
CIO們一般是將各種資料進行種類劃分,並搜集進資料倉儲,這是第一步,接下來根據設定好的資料模式來鋪相關資料,這意味著你在導入資料之前你就知道自己要做什麼,如果你後來改變了想法,資料就受到限制。
因此,有一種大資料倉儲,像「垃圾場」一樣,先運行分析程式,再發現關係。 許多CIO們並不知道他們在找什麼直到他們採集到資料.
5.大資料不僅僅只有Hadoop
許多人在談論大資料時,幾乎都指的是Hadoop資料分析平臺,但大資料並不僅僅只有這個平臺。
Monash Research分析師Curt Monash談到,近日,LexusNexus公司開放了其HPCC Systems平臺。 MarkLogic為非結構化資料配備了自己的資料庫, MarkLogic Server。 此外,Splunk search engine用於搜索和分析資料,例如伺服器登錄資訊分析。
(責任編輯:蒙遺善)