5月29日,百度董事長兼CEO李彥宏在召開的百度聯盟峰會上稱,互聯網領域有兩件事是BAT(百度,阿裡巴巴和騰訊的簡稱)不做或者沒有做好的事情:一是企業級軟體; 二則是大資料。 儘管大資料一詞已被各行各業人士炒得火熱,但真正將大資料「變現」的專案少之又少。
炒作大資料
五年前,谷歌的一個研究小組在全球頂級的科學雜誌《Nature》上宣佈了一個令人矚目的成果。 該小組可以追蹤美國境內流感的傳播趨勢,而這一結果不依賴于任何醫療檢查。 他們的追蹤速度甚至比疾控中心(CDC)要快的多。 谷歌的追蹤結果只有一天的延時,而CDC則需要匯總大量醫師的診斷結果才能得到一張傳播趨勢圖,延時超過一周。 谷歌能算的這麼快,是因為他們發現當人們出現流感症狀的時候,往往會跑到網路上搜索一些相關的內容。
谷歌預測流感趨勢的成功,很快就成為了商業、技術和科學領域中最新趨勢的象徵,並引起了人們對於一個行業概念——大資料的關注。
早在1997年,美國宇航局研究員邁克爾·考克斯和大衛·埃爾斯沃斯,就首次使用「大資料」這一術語來描述超級電腦生成的海量資訊。 今日,人們對大資料內涵的理解早已與考克斯和埃爾斯沃斯的提法不同。 大資料的定義轉變為:需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產。
終於,在2012年,「大資料」一詞被大規模地提及。 這一年,包括《紐約時報》、英國《金融時報》都集中談及了大資料的相關話題,有關大資料的書籍也可謂是汗牛充棟。
「大資料」炒作週期圖 資料來源:Gartner
國際權威IT研究顧問公司Gartner的最新調查報告顯示,「大資料」在2012年已經接近炒作的最高值,到今年,「大資料泡沫」時代即將結束。
從Gartner繪製的新技術「炒作週期圖」中可以看到:當一個新技術出現時,如果開發者宣稱這一技術可以「改變一切」,那麼它一定會佔據各大報紙網站的頭版頭條,然後也會有許多調查機構進行相關調查;當這一炒作達到一定階段時, 便不會繼續下去,即達到了期待頂點,關注度開始急速下降;隨後的一兩年之內,有些企業進入實戰階段,從實踐中總結出確實可以「改變一切」,同時負面言論也越來越嚴重;18個月之後,這一新技術再次興盛並穩定發展,從而提高生產力。
在2012年至2013年間,各行各業對大資料的瘋狂討論,將大資料的概念推至頂峰。 而到了2014年,輿論熱度回落,如何將大資料「變現」,便成為現實中各大企業真正需要面對的問題。
大資料變現難題
Gartner對全美720家企業進行了調查,結果顯示,僅有8%的企業已經開展了大資料項目目,其餘大部分企業都尚處於準備階段。
大資料的火熱與其商業模式的艱難形成強烈對比。 李彥宏在百度聯盟峰會上表示,雖然在過去兩年,人類生產的資料,是占全部人類文明史上所有資料總和的90%,「但我們每天產生的很多資料基本都是沒價值的資料。 」即使是像百度這樣已經將大資料的相關技術佈置就位的企業,李彥宏依舊認為真正想要的資料還是沒被搜集上來,「搜集上來的資料也基本沒有價值」。
中山大學心理學博士何淩南在最近幾年一直跟蹤觀察大資料的發展狀況,並與國內的凱迪資料服務中心等資料服務中心進行合作,他對記者表示:「對於大資料,資料本身並沒有價值,挖掘資料才有價值,並且,並不是單純地用統計方法就能分析資料 ,它需要更為深入的理論掌握。 」
目前,除了幾家大型企業外,大資料項目目的資料獲取與分析往往被分離開了,採集由商業公司來做,而分析則交給研究機構。 這樣的行業現狀直接導致了大資料的應用與商業計畫相脫節。
不過,何淩南博士對大資料項目目的未來依然保持樂觀,「目前,大資料的投入產出比比較低。 從短期來看,做資料獲取、分析,成本確實比較高,但長期看來,大資料的應用漸漸成熟以後,就能大大地節省成本,大資料的商業模式也會更加成熟。 」
清華大學電腦系教授馬少平認為:「雖然現在大資料被炒作的有些過分,但現狀確實是資料一直在成倍地增長,大資料的實質不會有變化,」資料總會有價值。
中國高等教育學會教育資訊化分會理事長蔣東興對馬少平教授的觀點表示贊同,他認為:「當前階段,大資料一定是要‘炒糊’的,之後再浪淘沙,這是客觀規律。 資料作為IT要素中最重要的因素之一,一定會長遠地得到重視和利用。