12月6日下午,陝西省工信廳副廳長蔡蘇昌在「2012西咸新區大資料高峰論壇」上演講前講了一件小事:一位北京的朋友在得知陝西要在北京召開關于大資料的論壇時調侃道:「你們陝西人一直挺實在的,怎麼現在也學會忽悠了! 」從物聯網到智慧城市,從雲計算到大資料,面對近幾年資訊技術領域日新月異的發展,習慣于從傳統產業發展視角看資訊技術發展的人著實感到眼花繚亂,而認為陝西發展大資料只是追風的懷疑顯然是這種心態的折射。
事實上,就在12月4日,IBM在京舉行了主題為「凝聚專家力,智贏大資料」的2012IBM PureData發佈盛典。 在發佈會上,賽迪智庫軟體與資訊服務業研究所所長安暉說:「我們預測今年中國大資料的市場規模將達到3.1億元,未來5年的複合增長率將達到75.2%,到2016年,市場規模將超過50億元。 」
同樣,陝西西咸新區也絕非跟潮追風,因為全國人口資訊處理與備份西安中心已經落戶西咸新區大資料產業園區。 雄心勃勃的他們希望到2020年建成2~3個百億級龍頭企業,實現園區產值500億元,從業人員超過5萬人,建成國家級大資料處理中心。 體量巨大的大資料無處不在
一談起大資料,似乎讓人覺得有些虛無縹緲,但通過一些真實的事例,就不難發覺大資料的挖掘是何等重要了。
今年3月,美國奧巴馬政府宣佈了大資料的研究和發展計畫,要投入2億美元啟動這一計畫。 在前不久結束的美國總統大選中,奧巴馬也成為大資料的直接受益者。 《時代》雜誌認為,奧巴馬贏得選舉的秘密之一是其競選團隊對資料的準確分析和把握,確保其投放的競選廣告更為有效,針對不同的人群採取不同的競選策略,利用Facebook推動大家投票。
安暉所長很喜歡兩部電影:一部是《點球成金》,講的是一個教練在俱樂部遭遇困難時,通過建立數學模型,利用各種比賽的資料然後贏得比賽的故事;另一部電影《少數派報告》是科幻片,講的是未來為了防止犯罪活動, 怎樣利用各種資料進行犯罪預測,並在犯罪可能出現之前就將犯罪的危險予以消除。 「可以看出這兩部電影的後臺都有一個很關鍵的詞——資料,通過資料可以贏得比賽,通過資料可以消除犯罪。 」安暉說。
在「2012西咸新區大資料高峰論壇」上,中國工程院院士倪光南表示,大資料是商業智慧發展的結果,但兩者又有不同:在資訊量上,商業智慧不太大,常為TB量級,而大資料資訊量非常大,常為PB量級;在資料特性方面, 商業智慧是結構化資訊,非即時資訊,而大資料主要為非結構化資訊,如文本、圖形、音訊、視頻、遙感遙測資訊,大多是即時資訊;在資訊來源上,商業智慧主要為企業交易資料,而大資料主要是社會日常運作和各種服務中即時產生的數位資料。
國家資訊化專家諮詢委員會常務副主任、中國工程院院士鄔賀銓在同一論壇上介紹,麥肯錫認為,全世界現在企業資料在硬碟上的存儲量是7EB,谷歌現在能夠處理的網頁數量在千億以上,每個月處理的資料總量超過400PB。 中國淘寶每天的交易量超過數千萬筆,百度目前的資料總量接近1000PB,中國聯通使用者的上網記錄每秒鐘有3萬條,一年可達到1萬億條。
IBM提供的資料顯示,據估計,過去兩年間產生的資料占目前全球資料的90%,新的資料正在以每天2.5EB的量級高速增長。 從資料中找到金子
在「2012西咸新區大資料高峰論壇」上,工信部軟體服務業司司長陳偉表示,大資料並非新近才突然冒出來的,大規模資料的分析處理與應用也不是一個新問題,只是近年來資料增長的速度越來越快,各行業積累的資料量越來越巨大。 「大資料中大量有用和可能沒用的資料並存,所以有的專家形象地描述大資料遍地是金子又遍地是沙子。 」陳偉進一步道,「大資料的目的就是要從龐大的資料集合中尋找到有價值的資料和知識,這種分析和挖掘將為各行業提供真正的智慧。 從這個意義上說,可以理解大資料是雲計算、物聯網、移動互聯網、智慧城市等新技術、新模式發展的必然產物。 」
鄔賀銓院士說,據麥肯錫統計,如果美國對保健行業的資料進行收集分析,整個行業收入一年可增加3000億美元;歐盟統計過,如果對管理資料進行挖掘,一年可以增加2500億歐元的價值;零售商可以利用大資料增加60%的收入。 而世界經濟論壇稱,大資料是新財富,價值堪比石油。 據預測,大資料會為全球帶來440萬個IT崗位,其中190萬個在美國,另外每一個大資料的崗位會催生3個非IT就業崗位,也就是說未來會推動美國產生600萬個就業崗位。
正是由於大資料巨大的發展前景與廣闊的市場空間,才吸引了眾多IT巨頭搶先佈局,以搶佔產業制高點。 賽迪顧問雲計算產業研究中心高級分析師劉新表示,2010年以來,歐美IT巨頭瘋狂展開與大資料相關的並購案,IBM通過並購資料倉儲廠商Netezza,以及InfoSphere BigInsights和Streams軟體廠商來增強自己在海量資料處理上的實力;EMC利用收購來的Greenplum、Isilon和VMware展開大資料和雲計算的佈局;惠普通過並購3PAR、Autonomy、 Vertica實現了大資料產業鏈的全覆蓋。 從各IT巨頭如谷歌、IBM、EMC、甲骨文、微軟、惠普、SAP紛紛推出的大資料產品可以看出,這些IT巨頭幾乎搶佔了搜索服務、資料庫、伺服器、存放裝置、資料採礦等核心價值環節。 據記者瞭解,中國已成為IT巨頭佈局大資料戰略的重要戰場。 例如:今年7月,英特爾在北京舉辦了主題為「芯動大資料、智領大機遇」的英特爾大資料論壇,8月,IBM宣佈全球首個大資料智慧賦能中心在北京正式成立。
在鄔賀銓院士看來,「誰掌握資料,誰掌握內容,誰就能控制整個產業鏈」。 現在百度的市值高於聯通,騰訊的市值高於電信,就很能說明問題。 面對井噴需求,切忌不實炒作那麼,中國大資料的情況又怎樣呢? 鄔賀銓院士認為,中國大資料的應用處于起步階段,淘寶、騰訊以及百度等互聯網巨頭是率先使用大資料技術的使用者,但他們主要基於開源軟體自主開發大資料應用。 「在大資料的挖掘開發利用和安全以及隱私保護方面,我們還缺乏相應的法律保障,國家需要通過體制改革來推動資料共用。 」鄔賀銓院士說。
賽迪顧問的分析師劉新分析認為,國內企業受限於IT產業鏈所處的位置,普遍在資料庫、資料倉儲、商業智慧等領域基礎薄弱,因此,在大資料上佈局不可能像跨國企業那樣如此全面。 但國內相對強勢的互聯網企業、電信運營商、電信設備供應商已經開始啟動產業佈局,以互聯網應用服務為切入點搶佔大資料制高點。 目前,阿裡巴巴已經在利用大資料技術提供阿裡信用貸款與淘寶資料魔方;騰訊則通過社交網路資料採礦打造全新行銷平臺,為廣告主實現精准行銷;百度建立了包括百度指數、司南、風雲榜、資料研究中心、百度統計等5大資料體系平臺, 提供企業即時資料服務;中國移動也在大雲計畫中展開了海量資料處理、海量資料存儲、高擴充性等技術研發;華為也挺進企業資料服務市場,並已推出了基於移動終端的資料分析方案與應用。
「隨著使用者對大資料價值的認可程度增加,市場需求將出現井噴,巨大商機也將吸引更多的企業加入,面向大資料超市的新技術、新產品、新服務、新業態會不斷湧現。 」劉新說。
對於大資料超市可能將出現的井噴需求,陳偉司長提出了自己的忠告:「大資料要務實推進,切忌不實炒作,面對具體的應用,一步一個腳印扎扎實實地推進大資料在國民經濟和社會發展各領域的深入應用。 」他認為,中國有世界上最複雜的應用和最大的市場,完全可以在大資料上實現技術和產業應用發展的超越。
(責任編輯:蒙遺善)