如果說大資料這一概念在以前還是主宰數位世界的帝王,那麼在2014年巴西世界盃上,它的光亮現身,已經被切實地打造成了一個超級現實主義的名詞:德國人就率先將大資料運用到足球訓練和比賽當中,通過設備傳感對球員跑動、 傳球等資料的捕捉和分析,並以「數位和事實」來優化備戰方案,提升球隊的成績。 德國隊的一系列戰績可以證明,大資料不再是「章魚保羅」的預言附會,而是用大資料來佐證結果的一系列成功鐵案。 世界盃落幕了但大資料預測還會繼續——從夜觀天象到氣象預報,從童話裡的水晶球到今日的科技預言家,從地震雲的傳說再到科學家高度關注的地震預測,人類一直希望能夠更早突破局限看穿未來。 隨著資訊革命的深入,大資料時代的預測更加容易,雲計算、雲儲存不再是虛擬世界的專利,人類的生活正在被大資料預測深刻改變。
大資料的應用日漸廣泛,通過累積的海量使用者行為資料,在進行篩選與分析的基礎上,可實現精准化的資料分析、定向服務等功能。 預測性分析,就是大資料最核心的價值與功能。 大資料預測的邏輯是,每一種非常規的變化事前一定有徵兆,每一件事情都有跡可循,如果找到了徵兆與變化之間的規律,就可以進行預測。 大資料預測無法確定某件事情必然會發生,它更多是給出一個理性概率。 這讓人們發現,一個大資料時代以及伴隨而來的大資料文化已經急不可耐地空降于現實生活。
其實,拍攝于1991年的好萊塢大片《終結者2 ·審判日》,就讓人們感受到了擁有海量資料的超級電腦的可怕:「天網」控制的機器人向人類發動戰爭。 這種對「異化」的警惕與反思,讓我們目睹了一場「數位毀滅實體」的血腥戰爭。 當然,任何科學家或者領導人都不希望出現《終結者》中的可怕景象,他們要始終牢牢掌握武器系統的控制權,決不能讓它們像終結者的 「老闆」天網那樣,成為屠殺人類的瘋狂機器。 大資料在布魯斯·威利斯主演的美國大片《虎膽龍威4》中再次顯示不可思議的威力:犯罪分子利用超級電腦控制了美國的交通、銀行、供電、煤氣系統,國家的命運似乎懸于手指與鍵盤之間,乃至於我們身邊的「人肉搜索」, 這也暗示了大資料是一把雙刃劍,它已經把傳統意義上的財富、武力構築的話語權,悄然演變成了一種強力的數位話語。
2014年3月29日,美國政府宣佈了「大資料研究和發展倡議」計畫,以推進從大量的、複雜的資料集合中獲取知識和洞見的能力。 該倡議涉及聯邦政府的6個部門(美國國家科學基金、美國國家衛生研究院、美國能源部、美國國防部、美國國防部高級研究計畫局、美國地質勘探局6個部門)。 這些部門承諾將投資總共超過2億美元,來大力推動和改善與大資料相關的收集、組織和分析工具及技術。 這份倡議中還透露了多項正在進行中的聯邦政府各部門的大通話方案。
過去發達國家運用類似方式在資訊領域進行研發,在超級計算和互聯網建設方面獲得了空前進步,今天美國政府的倡議又承諾了在科學發現、環境保護和生物醫藥研究、教育,以及國家安全等領域利用大資料能力的突破。 但是大資料擁有的資料視覺化和大資料採礦的功能,可以對已發生的資訊價值進行挖掘並輔助決策。 傳統的資料分析挖掘在做相似的事情,只不過效率會低一些或者說挖掘的深度、廣度和精度不夠。 大資料預測則是基於大資料和預測模型去預測未來某件事情的概率,讓分析從「面向已經發生的過去」轉向「面向即將發生的未來」,這顯示出大資料與傳統資料分析的最大不同。
學者們敏銳發現,在天氣預報之外,還有多個領域是大資料預測大展拳腳的空間。 比如體育賽事、股票市場、市場物價、使用者行為預測、身體健康預測、疾病疫情預測、交通行為預測等等領域,大資料預測還可被應用在房地產預測、就業情況預測、高考分數線預測、選舉結果預測、諾貝爾獎預測等等, 理性主義的具備可量化可驗證的洞察未來的能力,正在通過大資料打開一個時代。