隨著大資料時代的來臨,不管你是否認同,是否願意,是否能夠接受的,大資料已經來到,並且深刻的影響著我們的生活,這個事實是無法改變的。
就像空氣和水一樣,資料在我們周圍自然而然地存在著。 每一次點擊滑鼠,每一次刷卡消費,每一次撥打電話,每一次駕車出行...... 資料便已生成。 我們每一個人既是資料的消費者,也是資料的生產者,每天都生成海量資料。
研究表明,過去5年裡,人類行為產生的資料量增長了10倍,而在接下來10年中,這一增長將達到29倍。 軟體巨頭EMC公司預計,到2020年,全球資料使用量將達到大約40ZB(1ZB=10億TB)。 這些資料意味著什麼,對我們有何價值? 這就是當前最熱門的「大資料」研究。
被視為戰略資源
一家電信運營商運用社交分析,篩選了3.65億段電話記錄,找出可能流失的客戶並提供針對性的服務,大大提高了季度收益;一家金融服務公司從570億筆ATM交易中檢測出了欺詐模式...... 這是體現大資料價值的一些典型例子。
凱格總裁兼首席科學家傑米·霍華德說,與傳統的、結構化的、關聯式資料不同,「電話記錄」等資料是非結構化的。 據國際資料公司調查,非結構化資料在大資料中約占80%至90%,包括網路日誌、語音、視頻、圖片、地理位置、傳感資訊等。 作為新的尚未開發的資訊源,非結構化資料分析可以揭露以前很難或無法確定的重要相互關係。
「這是最關鍵的。 」大資料的出現讓人們放棄了對因果關係的渴求,轉而關注相關關係,人們只需知道「是什麼」,而不用知道「為什麼」,這顛覆了千百年來人類的思維模式,對人類的認知方式和交流方式提出了新挑戰。
除了體量大、資料類型繁多這兩個特徵外,能否快速即時處理海量資料是衡量是否是大資料的關鍵維度。 傑米·霍華德說:「大資料並非只有數百個TB才算得上,有時候數百個GB的資料也可稱為大資料,這主要要看資料的處理速度。 如果能在1秒之內分析處理通常情況下需要花費1個小時的資料,這種變化帶來的價值是非常巨大的。 」
目前,隨著移動互聯網、雲計算、物聯網等新一代資訊技術的普及應用,智慧手機、平板電腦、PC以及遍佈各個角落的感應器,正在越來越多地接入到網路,成為資料來源和承載方式。 各種交互資料、傳感資料正源源不斷從各行各業迅速生成。 這些數量龐大、種類廣泛、迅速產生和更新的大資料,蘊含著前所未有的社會價值和商業價值。
傑米·霍華德說,像能源、原材料一樣,大資料已成為提高未來競爭力的關鍵要素。 比如,通過遍佈各地的電子眼和監控攝像頭,警務系統可以基於大資料識別一些危險的人或危險的行為,發現苗頭進行預警。 比如,通過車上的GPS和手機,當交通進入擁堵狀態,交管部門可以通過手機信號的大資料運用,提示車主進入某個路段要收費,從而控制交通流量,等等。 麥肯錫的最新調查研究顯示,大資料可以在任何一個行業內創造更多價值。 如,零售業可以利用大資料提高60%的運營利潤,歐洲政府利用大資料每年可以減少1000億歐元的開支,同時避免偷稅漏稅行為。
鑒於大資料潛在的巨大影響,很多國家或國際組織都將大資料視作戰略資源,並將大資料提升為國家戰略。 美國政府把大資料看成是「未來的新石油」。 2012年3月,美國奧巴馬政府宣佈了「大資料研發計畫」,並設立了2億美元的啟動資金,希望增強海量資料收集、分析萃取能力,認為這事關美國的國家安全和未來競爭力。 聯合國推出的「全球脈動」專案,希望利用「大資料」預測某些地區的失業率或疾病爆發等現象,以提前指導援助專案。
評論:
將大資料比作「未來的新石油」,是非常貼切的,正是說明的了大資料蘊含的巨大資源價值,隨著大資料的發展,大資料應用的深入的,大資料的戰略資源價值會更加凸顯,應用範圍也會隨之擴大。