上知天文、下知地理、運籌帷幄、決勝千里,這說的可不是諸葛亮再世,而是當下最時髦的「大資料」。
什麼是大資料? 目前尚無一個標準概念,那些你在網上流覽新聞、收發郵件、下單購物等網路「足跡」都以「資料」的形式被記錄並存儲下來。 分析這些可追蹤、可分析、可量化的資料,能夠影響商業領域、醫療行業、政府機構的工作模式。
據《明鏡週刊》報導,2012年互聯網共產生2.8個10"21位元組(1個10"21位元組=1,000,000,000,000,000,000千位元組),專家預測到2020年,新資料將增加到40個10"21位元組,到那時, 每天新增的資料就需要205億個DVD光碟來存儲,且每隔兩年這個資料將成倍增加。
《紐約時報》《明鏡週刊》接連發表文章分析大資料對各行各業的改變,並探討對「資料暴政」(指資料驅動時代裡人的隱私空間和創新能力)的擔憂。
編譯/許敏
[IT業] 資料也可以轉變成金錢
臉書10億使用者的資料資訊至少值1000億美元
谷歌和臉書(國外的社交網站)就是純粹的大資料。 他們的商業模式是建立在對使用者資訊的收集、分析和分類之上,廣告商通過分析結果可以精准地投放廣告。 對臉書的投資商而言,臉書10億使用者的資料資訊至少值1000億美元(約合人民幣6131億元)。
目前,業界將大資料的商業機會分為兩類:一類是以IBM、微軟、惠普等公司提供「硬體+軟體+資料」的整體解決方案為代表,它以平臺性為特徵,提供基礎服務;另一類是以臉書、亞馬遜、谷歌等公司為代表,基於自身海量的使用者資訊, 提供精准行銷和個人化廣告推介等。
2012年,運用大資料的全球貿易達46億歐元(約合人民幣365億元),預計到2016年,這個數位將達到160億歐元(約合人民幣1272億元)。
[公務] 員警吃著午飯抓到小偷
大資料使用一年,聖克魯斯市盜竊案下降11%,警方破案率提高56%
大資料是很多人的幫手,但對於小偷來說卻是絆腳石。
美國加利福尼亞聖克魯斯市的員警在地下停車場附近就餐,沒幾分鐘就抓住了一名偷車賊。 神奇吧? 其實,員警之所以會選擇中午時分在停車場附近就餐,是因為大資料告訴他們那個點可能出現偷車行為。
過去兩年,聖克魯斯市近100個警察局在日常工作中都用到了大資料,通過分析警方提供的相關資料,大資料預測具體時間、具體地點可能會發生盜竊、搶劫、偷車等行為,説明警方辦案。 不過殺人等行為暫時沒法預測。
「一開始,我們對此都很懷疑。 」聖克魯斯市警察局副局長斯蒂芬·克拉克說。 「但這些資料證明了自己的準確性和有效性。 」斯蒂芬介紹,大資料使用一年來,聖克魯斯市的盜竊案下降11%,偷車案下降8%;警方破案率提高了56%。
[娛樂] 網站預測《紙牌屋》會紅
Netflix在全世界有3300萬使用者,比誰都清楚大家喜歡看什麼電影
美國線上觀影網站Netflix也受益于大資料。
Netflix最開始的業務是出租DVD,現在為3600萬客戶提供線上觀看電影業務。 通過眾多資料分析,Netflix成功預測美劇《紙牌屋》會紅。
Netflix在美國有2700萬訂閱使用者,在全世界有3300萬,它比誰都清楚大家喜歡看什麼樣的電影和電視。 有研究表明每天的尖峰時間網路下載量都是出自Netflix的流媒體服務,去年人們在網上看流媒體視頻的時間比看實體DVD的時間還多。 每天使用者在Netflix上產生3000萬個行為,比如你暫停、重播或者快進時都會產生一個行為,Netflix的訂閱使用者每天還會給出400萬個評分,還會有300萬次搜索請求,詢問劇集播放時間和設備。
它知道使用者很喜歡大衛·芬奇(《七宗罪》的導演),也知道凱文·史派西主演的片子表現都不錯,還知道英劇版的《紙牌屋》很受歡迎,三者的交集預測了《紙牌屋》的成功。
[生活] 「魔法地毯」能自動報警
地毯存儲步伐次數,如果屋主的步數少於正常範圍,會發出警報
曼徹斯特大學利用大資料發明了一種「魔法地毯」,它能説明獨居者在出現異常時及時發出警示。 從外表上看,「魔法地毯」和普通地毯沒啥區別,同樣鋪在地板上,但「魔法地毯」存儲了獨居者每天走路的步伐次數。 如果獨居者這一天走路的步數少於正常範圍,「魔法地毯」就會發出警報,儘早提醒是否出現意外。
由85個雇員組成的公司BlueYonder是一家分析大資料的公司。 該公司通過綜合梳理超市刷卡資訊、天氣資訊、學校放假資訊以及交通報告等資料,為像沃爾瑪這樣的零售商提供「精准的預測」。
這些「預測」對商家來說非常重要,因為它能避免發貨錯誤、降低存儲成本。
舉個例子,BlueYonder曾建議某家超市將牛奶、巧克力棒和蘋果放在一起,幾天之後,這三種商品銷售量大增。 真正的原因是,BlueYonder瞭解到超市附近新開一所學校,公司分析了人群特徵得出了結論。
觀點:需要警惕「資料暴政」
沒錯,大資料之于商業等領域真是如虎添翼。 但對普通消費者來說,利與弊孰輕孰重?
一份由奧美公司所作的調查報告顯示,75%的人不希望企業存儲自己的個人資訊,有90%的人反對企業收集自己上網流覽網頁的記錄。
微軟研究院的高級研究員博伊德曾表示:「如今,我們社交網路化的社會絕對有製造恐慌的天分。 在大資料時代,對隱私洩露的擔憂就是強大的緊張和焦慮的源泉。 人們普遍認為,最令人焦慮的在於你根本不知道什麼時候自己的隱私就無意中被洩露出去。 」
人們最擔心的,是對這種資料的無限制利用。 美國暢銷書《爆發》中指出,人的行為看似隨機無序,但實際上是存在某種規律的。 社交網路如此發達的今天,大資料把人的行為進行放大分析,從而能夠相對準確地預測人的性格和行程。 所以,不排除有這樣一種可能:在忙完了一天的工作之後,你還沒有決定要去哪兒,資料中心卻早就先于你準確預測了接下來的目的地。
這向我們提出警醒:大資料時代,如何界定大資料的權益歸屬? 如何控制大資料的使用風險? 如何保持我們全社會的資料民主?
另外,有多少人會真的願意接受一個「數位驅動經濟」的世界? 那些資料能預測你的孩子在學校表現得怎樣、什麼工作適合他/她、他/她有多大可能會變成罪犯、有多大可能會患病,你真的願意活在一個如此清晰預測未來的世界?
電視臺或音樂唱片公司通過資料分析能夠較好地迎合觀眾或聽眾的口味,但對於創意產業來說真的利大於弊嗎? 那些創新、直覺和驚喜又去哪裡了呢?
互聯網專家葉夫根尼·莫羅佐夫提出「資料暴政」的概念,他指出,那些基於大資料制定的政治、經濟決策,每隔一段時間要由獨立的審計員進行核查,以防出現濫用數位力量的情況。
(責任編輯:蒙遺善)