「數」中自有黃金屋 大資料的理想與現實

來源:互聯網
上載者:User

仿佛只是一夜之間,「大資料(Big Data)」火了。


那一個個關於大資料的傳奇故事,一樁樁爭奪大資料制高點而展開的並購案,一個接一個輪流發佈大資料戰略的IT廠商,還有那一場場以大資料為主題的各種研討會,無一不在宣告,IT界又迎來了新的興奮點、新的機遇,同時,也是新的挑戰。


「數」中自有黃金屋


嚴格地說,大資料並非一個新詞,被譽為「資料倉儲之父」的Bill Inmon早在上個世紀90年代就經常將「Big Data」掛在嘴邊了。 大資料之所以在近一兩年迅速走紅,要歸結于互聯網、行動裝置、物聯網和雲計算的迅猛發展,使得人類每分每秒都在產生巨量資料——從出現文明到2003年,人類總共才創造 5 EB(5 ExaBytes)的資料, 但是我們現在僅在兩天內就創造出相同的資料量。 來自IDC全球存儲及大資料研究專案副總裁Benjamin Woo表示,到2020年,全球資料使用量預計暴增44倍,達到35.2ZB。 35ZB是什麼概念呢? (1ZB=1024EB=1048576PB=1073741824TB,1073741824TB×35=37580963840TB),也就是說全球大概需要376億個1TB硬碟來存儲資料。


但是大資料並非單指資料量之大。 對於大資料,IDC的定義是:「為了更經濟地從高頻率獲取的、大容量的、不同結構和類型的資料中獲取價值,而設計的新一代架構和技術。 」人們普遍將該定義概括為四個V,即更大的容量(volume,從TB級躍升至PB級,甚至EB級)、更高的多樣性(variety,包括結構化、半結構化和非結構化資料),以及更快的生成速度(velocity)。 前面三個「V」的組合推動了第四個因素——價值(value)。


關於大資料所蘊含的價值,有許多為人所津津樂道的故事可以佐證:


美國印地安那大學和英國曼徹斯特大學的學者通過提取Twitter上的非結構化資料分析公眾情緒,再將情緒曲線與道鐘斯工業指數進行對照分析,發現可以提前3~4天預測股市大盤走勢。 基於此,他們已經推出了歐洲第一隻基於社交媒體的對沖基金。


(單位:百萬美元)


又例如,英國的科學家根據Twitter的資料來跟蹤流感的爆發。 他們主要基於使用者發佈資訊中的關鍵字,例如「我頭痛」等,並結合使用者的發佈地點,按區域與英國衛生部的官方資料進行了比較,最終建立起一個預測模型。 創業團隊「SickWeather」甚至以預測疾病為主題開展了自己的創業專案。


象這樣的大資料經典案例還有不少,而整個商業社會對大資料將帶來的影響給出了極高的評價——


麥肯錫全球研究機構在2011年5月發佈的《大資料:創新、競爭和生產力的下一個前沿領域》中表示,充分利用大資料可説明全球個人定位服務提供者增加1000億美元收入、説明歐洲公共部門的管理每年提升2500億美元產值、 説明美國醫療保健行業每年提升3000億美元產值,並可説明美國零售業獲得60%以上的淨利潤增長。


在今年年初的瑞士達沃斯論壇上,一份題為《大資料,大影響》(Big Data,Big Impact)的報告宣稱,資料已經成為一種新的經濟資產類別,就像貨幣或黃金一樣。


而《華爾街日報》在文章《科技變革即將引領新的經濟繁榮》中更是大膽預測:「我們再次處於三場宏大技術變革的開端,他們可能足以匹敵20世紀的那場變革,這三場變革的震中都在美國,他們分別是大資料、智慧製造和無線網路革命。 」


更加值得關注的則是,美國已經把大資料上升到了國家戰略的層面。 根據美國白宮今年3月29日新聞,奧巴馬政府宣佈投資2億美元啟動「大資料研究和發展計畫」,希望增強收集海量資料、分析萃取資訊的能力。


在我國,大資料作為一個較新的概念,目前尚未直接以專有名詞被我國政府提出來給予政策支援。 不過,在2011年11月28日工信部發佈的物聯網「十二五」規劃上,資訊處理技術作為四項關鍵技術創新工程之一已經被提出來,其中包括了海量資料存儲、資料採礦、圖像視頻智慧分析,這都是大資料的重要組成部分。 而另外三項關鍵技術創新工程,包括資訊感知技術、資訊傳輸技術、資訊安全技術,也都與大資料密切相關。


大資料的價值和重要性已經毋庸置疑,但大資料究竟帶來了哪些新的技術趨勢,它對當前IT產業的勢力格局會造成何種影響,更關鍵的是,每個企業如何才能獲取大資料中的「寶藏」?則是我們真正關注的焦點。

(責任編輯:蒙遺善)

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.