在移動互聯網時代,大資料的開發和利用已成為熱點。 然而,龐大的資料常讓企業和科研單位束手無策,不知道如何挖掘其價值。
本報記者 彭科峰
在移動互聯網時代,大資料的開發和利用已成為熱點。
小米可以利用使用者對安卓系統的優化需求資料,制定完善miu系統,並開發小米手機;京東利用廣泛的線民手機購買記錄,交給廠商訂制jdphone手機;科學家能依據實驗產生的大量資料,通過特定模型,尋找出某一事物的普遍規律, 從而在藥物設計、基因組研究等領域大有作為......
在日前相繼召開的「科學資料大會」「全球移動互聯網」大會上,大資料應用問題成為眾多院士、專家、企業人士熱議的焦點。 探究大資料的應用前景,已成當務之急。
大資料無處不在
在互聯網時代,普通大眾早已習慣生活在大資料之中。 無論是每天上網搜索新聞,還是利用互聯網玩遊戲,或登陸購物網站購買物品,每位線民每時每刻都在為互聯網增加新的資料。
這些資料已成為科技企業瞄準的焦點。 金山集團CEO張宏江向記者表示,當前互聯網領域所有的企業都在利用使用者的這些資料作一些非常關鍵的商務決定。
「金山的遊戲、安全軟體,都在充分利用大資料帶來的便捷。 例如,金山在市場上做得很成功的"清理大師",其月活躍使用者已超過1.5億。 這款產品能夠成功,離不開對所有應用特性的分析,而這本身就是大資料應用一個非常好的例子。 」張宏江說。
在科研方面,對於大資料的分析也成為熱點。 「在基因組研究領域,對於大資料的分析有助於我們進行疾病的診斷與治療、全新的藥物設計與研發、動植物新品種的培育等。 」中科院院士陳潤生表示。
應用尚須實現「三步走」
與此同時,龐大的資料常讓企業和科研單位束手無策,不知道如何挖掘其價值。
中國人民大學資訊學院教授孟小峰認為,大資料代表著未來IT產業發展的重大方向。 「現在的資料來源是自動產生的,無處不在的感知系統源源不斷地產生各種資料類型,其不但分佈廣泛,而且存在動態演化的趨勢。 」在這樣的情況下,對大資料的分析和處理成為難點。
「現在的情況是大資料看上去前景很好,但是雜亂無序。 」達沃時代科技有限公司法人張松坦言。
張宏江則認為,挖掘大資料的應用價值,發揮大資料的社會效用,關鍵在於能否完成三步進化,「即從資料到資訊、從資訊到智慧、從智慧到價值的轉變」。
建立開放平臺實現資料共用
一份IDC(互聯網資料中心)的數位宇宙報告曾指出,當前大量有效資料正在丟失,大資料的前途取決於從大量未開發的資料中提取價值。 然而,大多數新的資料是基於文檔未被標記的非結構化資料,人們對其知之甚少。
IDC中國區總經理霍錦潔也表示,根據他們的一份研究報告,只有三分之一的資料是有價值的。 這意味著有太多的資料仍須開發利用。
張宏江則認為,如果希望看到未來大資料的技術在更多行業得以應用,「很重要的一點就是有開放的平臺,讓更多的資料分享出來」。
他進一步指出,基本上所有互聯網的服務商都是資料的重要來源,它們本身可能提供一些資料服務,為自己的產品服務,但這些資料對於其他公司可能也有價值。 因此,未來可以在把好隱私、安全關卡的條件下,將資料本身作為資源分享給其他使用者,讓其創造價值。
「未來如果將大資料作為一種產業來看的話,一定需要一個開放平臺,讓大家可以共用。 」張宏江表示。
《中國科學報》 (2014-05-13 第4版 綜合)