對於大多數人來說,「大資料」還是一個陌生的術語,但它的威力已無所不在:信用卡公司追蹤客戶資訊,能迅速發現資金異動,並向持卡人發出警示;能源公司利用氣象資料分析,可以輕鬆選定安裝風輪機的理想地點 ;瑞典首都斯德哥爾摩使用運算程式管理交通,令市區擁堵時間縮短一半......
牛津大學教授維克多·梅耶-舍恩伯格在其新書《大資料》中說,這是一場「革命」,將對各行各業帶來深刻影響,甚至改變我們的思維方式,但同時它也引發「資料暴政」的擔憂。
商業:提供「精准預測」
在一些公司、實驗室和政府機構,「資料」被捧為21世紀新型「石油」或「黃金」。 一些統計學家、物理學家和所謂的資料科學家從中獲利豐厚,他們服務于大資料應用程式開發公司,「藍色彼岸」便是其中之一。
「藍色彼岸」成立于5年前,目前有85名員工。 經理尤韋·魏斯介紹,公司利用自行開發的軟體,分析超市刷卡記錄、天氣資訊、學校放假資訊和交通報告等資料,為客戶提供「精准預測」。 他們的客戶包括德國郵購業泰斗奧托集團和dm連鎖藥店。
魏斯說,「藍色彼岸」的軟體不僅能從單條資訊中分析出更多內容,而且能發現資訊間關聯,對零售業極為有用,可以避免發貨出錯,最大限度降低庫存成本。
奧托集團說,自從使用「藍色彼岸」的軟體,銷售預測準確度提高20%到40%。 它準備把該軟體應用推廣到公司運動品牌零售商SportScheck,並收購「藍色彼岸」50%股權。
「大資料正在重塑整個經濟,我們只是處於起步階段,」魏斯說。
醫療:開啟個人化治療
位於柏林巴伯爾斯貝格地區的哈索·普拉特納研究所(HPI)可能成為數以百萬計癌症患者的希望。 研究所二樓的電腦房常年保持低溫,以免價值150萬歐元的處理器過熱。 普通電腦只有1個處理器,但那裡的每台電腦有40個處理器,運算速度是傳統電腦的1000倍,甚至更快。
普拉特納是全球最大的企業管理和系統化商務解決方案供應商「思愛普」(SAP)創始人,也是HPI贊助人。 他介紹說,HPI的漢娜資料庫技術始于一個名叫「Sanssouci DB」專案,由8個大學生創立,曾獲得創新大獎,如今已成為「記憶體儲處理」的代名詞。
HPI負責人、數學家克里斯多夫·邁內爾認為,該技術不僅有廣泛的商業前景,而且為癌症治療提供機遇,「我們正站在個人化醫療的門檻上」。
邁內爾說,每一種腫瘤都不盡相同,這意味著同樣的治療方法對不同人會產生不同效果。 目前,為了給患者制定有針對性的治療方案,需花費數月破譯其基因組。 這並不奇怪,因為每個人有大約30億個DNA「積木」。 但在HPI「超級大腦」的説明下,破譯基因組只需要短短數秒。
此外,HPI的電腦可以從公共基因庫中精選所有資訊,為每一個患者尋找到最合適他症狀的治療方案。 「目前,這種搜索配對過程還需花費數月時間,」邁內爾說。
安全:助力抓賊反恐鬥駭客
在美國加州聖克魯斯市一個地下車庫,一名小偷正在撬車,卻被幾米開外正在一輛車裡吃午餐的員警逮了個正著。 這名員警並非「碰巧」出現在那裡,而是根據一個電腦軟體的推薦在此守株待兔。
過去兩年裡,這座城市的員警換班時,都會根據長官和軟體發出的指示外出巡邏。 該軟體輸入了警方所有資料,不斷更新,用於計算何時何地可能發生夜盜、搶劫、偷車等犯罪行為,其中三分之二切實發生了。
這一軟體由電腦專家喬治·莫勒和從事犯罪學研究的人類學家傑佛瑞·布蘭廷漢姆聯合編寫,參照了預測地震餘震的程式模式。 聖克魯斯警察局副局長史蒂夫·克拉克于2011年偶然得知這一創意,三人共同開展了一個測試專案。 他們把聖克魯斯市8年來的犯罪記錄輸入程式,再加上其他潛在相關資料,比如天氣狀況、公園資訊和公交線路等。
「起初,很多人持懷疑態度,包括我自己,」克拉克說,「但資料本身證明其確實有效。 」據他介紹,使用犯罪預測系統一年後,夜盜案件減少11%,盜車案件減少8%,破案率大幅提升56%。
除警察局外,軍隊和情報機構也非常重視資料分析。 比如,在搜尋本·拉丹的過程中,「大資料」就發揮了重要作用,正是資料庫分析讓調查人員把目光聚焦在巴基斯坦的阿伯塔巴德。
Splunk是情報界和軍方炙手可熱的軟體供應商,總部設在三藩市一家舊香腸工廠裡。 不久前,在科技記者評出的全球最具創意的公司中,Splunk名列第5,而谷歌僅列第11位。 全球超過90個國家的政府、機構、企業在使用Splunk的應用軟體,包括美國五角大樓和國土安全部。 這家公司分析、破譯來自各種機器的資料,包括手機信號塔、空調、網站伺服器和飛機等。 Splunk產品部高級副總裁圭多·施羅德說,分析渦輪機提供的資料有助於最大程度降低燃油消耗,優化維修間隔期。
「安全領域是‘大資料’應用增長最快的領域之一,」施羅德說。 除對付犯罪和恐怖主義外,Splunk的軟體還能查明駭客攻擊等網路犯罪。
警惕「資料暴政」
個人化服務是「大資料」應用程式魅力所在。 比如,如果有人在「臉譜」上表示「喜歡」某款牛仔褲,當他下次進入該店鋪時,就可能收到店主給他發送的同品牌牛仔褲的打折資訊。 看起來,這對零售商和消費者都有好處,但主張保護資料隱私的人卻認為,「大資料」理念其實與「專制獨裁」沒有區別。
為消除人們顧慮,許多公司強調他們收集、儲存、分析資料都是「匿名」,但事實上可能並非如此。 線上期刊《科學報導》近期一項研究顯示,每個人有自己的行動模式,95%的人可能被識別。 普林斯頓電腦科學家阿爾溫德·納拉亞南在其博客上說,可供分析的資料越多,就越不可能保持「匿名」,識別一個人只要33個位元組的資訊量。
在現代社會,一個更加迫切的問題是:人們是否真的願意接受一個「數位驅動經濟」的世界?在這個世界裡,資料分析能預測你的孩子在學校表現如何,他將來適合怎樣的工作,誰有多大幾率犯罪或得癌症, 電視臺和唱片公司能根據預測迎合觀眾或聽眾的口味...... 但在這個一切都計算好的世界裡,創意、靈感和驚喜在哪裡?
互聯網哲學家葉夫根尼·莫羅佐夫對許多「大資料」應用程式背後的意識形態提出尖銳批評,警告即將發生「資料暴政」。 他提出,那些「大資料」應用程式應當接受獨立審計人定期審查,以防權力濫用。
「大資料」行業巨頭谷歌的一次不經意行為,顯示了人們對「資料暴政」的警惕。 谷歌董事長埃裡克·施密特說,公司在2010年曾閃過這樣一個玩笑想法:通過資料分析預測股票價格,但後來放棄了,因為公司高管認為,這可能不合法。
但他沒有說,這是不可能的。
(責任編輯:蒙遺善)